Gene Mlg_1963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1963
Symbol
ID	4268165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2232425
End bp	2233444
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	638126718
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_742795
Protein GI	114321112
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.787687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0372303
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTTT TCACAGAACT TTTCTGGATA ACGCTCAAGA TCATGGCGCT GGTGGTGCCG 
CTGATGCTTG CAGTGGCTTA CCTGACCTAC GCCGAGCGCA GGGTCATCGG GGCGATGCAG 
GACCGACGCG GCCCGAACCG CGTGGGCTAT CAGGGGTTGT TGCAGCCGAT CGCGGACGCG 
CTGAAGCTGG TCATGAAGGA GATCAGCATC CCGTCCAACG CCAACCGGGT CCTGTTCGTC 
ATCGCACCGT TGCTGGCCAT CATGCCCGCA CTGGCGGCCT GGGCGGTCAT TCCGGTGGCC 
GAGGGCTGGG CCATCGCCGA TATCAACGCG GGTCTGCTCT ATATCCTGGC CATGACCTCC 
CTGGGGGTCT ACGGCATCAT CATTGCCGGC TGGGCCTCCA ACTCCAAGTA CGCCCTGTTG 
GGGACCCTGC GGGCGTCCGC GCAGGTCGTC TCCTACGAGA TTGCCATGGG CTTCGCCCTG 
GTCGGCGTGC TGATGGCGGC CGGTTCCATG AACCTGGGCC AGATCATCCA GGCCCAGGCG 
GGCGGTATCT TCCACTGGTT CTGGCTGCCG CTGTTGCCGC TCTTCCTGGT CTACTGGATC 
TCCGGTGTGG CCGAGACCAA CCGCGCACCC TTCGACGTTG CCGAGGGCGA GTCCGAGATC 
GTCGCCGGCT TCCACGTGGA GTACTCGGGG ACCTCCTTCG CGGTCTTTTT CCTGGCGGAA 
TACGCCAACA TGATCCTCAT CTCCGCGGTG GCCGCGGTGA TGTTCCTGGG GGGCTGGTAT 
TCGCCCTTCC ACGGTTGGCC GATTTTGGGC CCGATGCTCG ACTGGGTCCC CGGTGTCGTC 
TGGTTCATGC TCAAGACCGC CTTCTTCATG TTCTGTTACC TGTGGTTCCG CGCCACCTTC 
CCGCGATACC GCTATGACCA GATCATGCGG CTGGGGTGGA AGGTGCTGAT CCCGGTCACC 
GTGGTCTGGC TCATCGTGCT GACCATCTTC ATCGTCACCG GCTTCGGGCC CTGGTTCTGA

Protein sequence

MAVFTELFWI TLKIMALVVP LMLAVAYLTY AERRVIGAMQ DRRGPNRVGY QGLLQPIADA 
LKLVMKEISI PSNANRVLFV IAPLLAIMPA LAAWAVIPVA EGWAIADINA GLLYILAMTS 
LGVYGIIIAG WASNSKYALL GTLRASAQVV SYEIAMGFAL VGVLMAAGSM NLGQIIQAQA 
GGIFHWFWLP LLPLFLVYWI SGVAETNRAP FDVAEGESEI VAGFHVEYSG TSFAVFFLAE 
YANMILISAV AAVMFLGGWY SPFHGWPILG PMLDWVPGVV WFMLKTAFFM FCYLWFRATF 
PRYRYDQIMR LGWKVLIPVT VVWLIVLTIF IVTGFGPWF