Gene Mfla_2054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_2054
Symbol
ID	3999850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	2194006
End bp	2195025
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	637938973
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_546162
Protein GI	91776406
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.470094
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCGG AAATGCAAAC CATGCTTGGT CCGCTGTGGC CTGTGGCCTG GAACCTGCTC 
AAGATCATTG CCATTGTCGG CCCGCTGATG GGTGCCGTGG CTTACCTGAC CTTGGCCGAG 
CGCAAGGTGA TTGGATTTAT GCAGGTGCGT ATGGGGCCGA ACCGTGTCGG ATATCGAGGT 
TTGCTGCAGC CATTGGCGGA CGGCGTCAAA CTGCTGATGA AGGAAATCAT CATTCCGAGC 
GCGGCGAGCC GGACCCTGTT CCTGCTCGGC CCGGTGCTGG CCATTGCCCC TGCATTGGCG 
GCCTGGGCCG TGGTGCCTTT CGACCTGACC CTGGTGCTTG CCGATATCGA TGCCGGCCTG 
CTCTATATTC TGGCGATGAC TTCTGTTGGT GTGTATGGTG TCATCATCGC TGGCTGGGCA 
TCCAACTCGA AATATGCCTT CCTGGGCGCA ATGCGATCCG CCGCCCAGAT CGTCTCTTAT 
GAAATCGCAA TGGGGTTTGC CCTGGTGGGT GTGTTGATGT CTGCCAACAG CCTCAATCTG 
GGCAAGATCG TGCTGGCCCA GTCCGGCGGT TTCTGGGAGT GGTACTGGCT GCCGTTGTTT 
CCCTTGTTCA TTGTGTATTT CATCAGCGCG GTGGCGGAAA CCAACCGGGC GCCGTTCGAT 
GTGGCGGAAG GCGAGTCGGA AATCGTGGCT GGCTTCCACG TGGAATATTC CGGTATGGCA 
TTCGCGGTGT TCTTCCTGGC GGAGTACGCC AACATGATCC TGGTGGCCAT GCTTGCGGCA 
CTGATGTTTC TCGGTGGCTG GTTGTCGCCG GTGCCGTTCC TGCCCGACAG CATTTTATGG 
TTGCTGTTCA AGGTGGCTGC CTTACTGTTC TTCTTCCTCT GGTTCCGTGC TACTTTCCCG 
CGCTATCGCT ATGACCAGAT CATGCGCCTG GGCTGGAAAG TATTCATCCC CGTGACCTTG 
GTATGGATAT TGTTTGTGGG TGCGATGATG CAGACGCGCT GGGCTTATTT GTTTCATTGA

Protein sequence

MIAEMQTMLG PLWPVAWNLL KIIAIVGPLM GAVAYLTLAE RKVIGFMQVR MGPNRVGYRG 
LLQPLADGVK LLMKEIIIPS AASRTLFLLG PVLAIAPALA AWAVVPFDLT LVLADIDAGL 
LYILAMTSVG VYGVIIAGWA SNSKYAFLGA MRSAAQIVSY EIAMGFALVG VLMSANSLNL 
GKIVLAQSGG FWEWYWLPLF PLFIVYFISA VAETNRAPFD VAEGESEIVA GFHVEYSGMA 
FAVFFLAEYA NMILVAMLAA LMFLGGWLSP VPFLPDSILW LLFKVAALLF FFLWFRATFP 
RYRYDQIMRL GWKVFIPVTL VWILFVGAMM QTRWAYLFH