Gene Mlab_0469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0469
Symbol
ID	4795239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	446863
End bp	448083
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	55%
IMG OID	640099126
Product	hypothetical protein
Protein accession	YP_001029910
Protein GI	124485294
COG category	[S] Function unknown
COG ID	[COG4260] Putative virion core protein (lumpy skin disease virus)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.87951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCT TCTCAAAAAC AAACAAAACC ATCGGCTCCG GTTCGGATAT CGAGGGTGCA 
GAATCCAGAA AAGGCTTCTA CTGGGTCGAT GATCAGAAGG GTGACAACGT CATCTGGCGT 
CTCCCAAGAA ACGTTATGTG GAACGACAAC GTGCTCGTCC GCGAGGATGA GTATGGTATC 
TTCTTCCGGG ACGGGAAAGC TCTCGTCGTT TTCGACCGCC CCGACAGATA TGCCCTGACG 
ACCGAGAACA TCCCGGTCCT GAAAAGTATT CTTGGAACTG TTGTTGGAAA CGTTCAGATC 
GGAGAGTTCT ACTGGGCACA GAAGCGTGAG TTCCGGGATA AGTTCGGGAC TCCGCAGCCT 
CTTGCATTCC GCGATGTGGA CTTCGGTGTT GTCCAGCTCA GAATCTTCGG TCAGTTCTCC 
TACAAAGTTG TCGATCCGCT GCTTCTGATC ACCCAGTTCG TCGGAACAAA AGGCCTGACG 
AAATCCGAGG AGATCGTCGA GTGGCTGAAA TCGCAGATCG TGATGATCTT AAACGATACC 
CTCGGCGAGC TGAAAGCAAA GAAGCAGATG GGTGTTCTGG ATATGCCTGC ATATCTGCAG 
GAGATCGAGC AGCTCTGCCT TGGCAAACTG ACGACCGAGA CAGAAGTGTA CGGTCTGAAG 
ATCATGAAGT TTGCCGGCCT GAACATCAAC ATGCCCGAAG AGGTTCAGGA AGCGATCAAC 
AAACGCGGAG CAATGTCTGC TCTGGGCGTG AACTATCTCC AGTATGAGTC CGGAAAAGCT 
ATCGAAGGCA TCGGACAGGG AGCCGCCCAA GGCGGAGAAG GCTCCGGATT TGCCATGATG 
GGTGCAGGAA TGGGCGCCGG AATGAGCATG GGCGGCATGA TGACCCAGAG CATGGCAGGT 
GCAGGAGGCC AGCCGGCTCC CTTTGGCGGT CAGCCGGGAG CAGGCCAGGC TGCAGCACAA 
CAACCGACCG GGAAAATGGA GACATGCAGC AACTGCGGAG CAAAGGTCCC GGCAGGCACG 
AAGTTCTGCC CGGAGTGCGG CCAGAAGATG GTGCCTGCGG GCGGTTCAAC CTGCACAAAC 
TGCGGAGCGA CTCTTGCACC AGGCGCTAAA TTCTGCCCCG AGTGCGGTAC AAAAGTCGAG 
ACCATCAGGA GATGCCCGAA ATGCAATGCC GTGGTCCCTG CCGGAACAAA GTTCTGTCCT 
GAATGCGGAC AGAAGCTCTA A

Protein sequence

MSFFSKTNKT IGSGSDIEGA ESRKGFYWVD DQKGDNVIWR LPRNVMWNDN VLVREDEYGI 
FFRDGKALVV FDRPDRYALT TENIPVLKSI LGTVVGNVQI GEFYWAQKRE FRDKFGTPQP 
LAFRDVDFGV VQLRIFGQFS YKVVDPLLLI TQFVGTKGLT KSEEIVEWLK SQIVMILNDT 
LGELKAKKQM GVLDMPAYLQ EIEQLCLGKL TTETEVYGLK IMKFAGLNIN MPEEVQEAIN 
KRGAMSALGV NYLQYESGKA IEGIGQGAAQ GGEGSGFAMM GAGMGAGMSM GGMMTQSMAG 
AGGQPAPFGG QPGAGQAAAQ QPTGKMETCS NCGAKVPAGT KFCPECGQKM VPAGGSTCTN 
CGATLAPGAK FCPECGTKVE TIRRCPKCNA VVPAGTKFCP ECGQKL