Gene GM21_4003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4003
Symbol
ID	8139377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4587047
End bp	4588096
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	644871619
Product	NADH dehydrogenase (quinone)
Protein accession	YP_003023777
Protein GI	253702588
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	5.90654e-20
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATACGC TAATCTTAGG ACTGCCTGTC GCGTACTACA TAGCCATGGT TGCCAAAGTG 
CTCGTAGCCT TTGTCTTCGT GCTCCTGACC GTGGCCTACG CCACCTACGC GGAGCGCAAG 
ATAATCGGGC ATATGCAGGT GCGCCTGGGT CCCATGAGGA CCGGCTGGCA CGGACTGCTG 
CAGCCGATCG CGGACGGCGT CAAGCTGTTC TTCAAGGAGG AGATCGTCCC GACTCAGGCA 
AGCAAGTTCG CCTTCCTGAT CGCTCCCTTG GTCGCCTTGA TCCCGGCGTT CATATCCTTC 
GCCGTCATCC CCTTTGGCGC CCCGGTGACC ATCGCCGGTT ACACGGTCCC GCTGCAGATC 
GCGGCCTACT ACGACCAGGC AGGTCAGCAG GTCTTCGACG TCAACGTCGG CGTCCTCTAC 
ATCCTCGCCA TGGCGAGCCT CGGGGTCTAC GGCGTGGTCC TCGCGGGTTG GGCCTCCAAC 
TCCAAGTACT CGCTTCTGGG CGGCCTTCGT TCCGCGGCGC AGATGATCTC CTACGAACTC 
GCCGCCGGCC TCGCGATCAT CGCCGTCTTC ATGCTCTCCG AGTCGCTGTC GCTGCACAAG 
ATCGTCGCCG ACCAGGCCAA CGGTGCCTGG TACGTATTCA AACAGCCGCT CGCCTTCGTG 
ATCTTCTTCA TCTGCTCGCT GGCTGAGATA AACAGGACCC CGTTCGACCT TCCCGAGGCG 
GAGACGGAGC TCGTGTCCGG CTTCATCACC GAGTACTCCT CCATGAAATA CGCCATGTTC 
TTCATGGCCG AGTACGCCAA CATGATCACC GTCTGCGCGG TCACCACCAC CCTGTTCCTG 
GGCGGCTGGC ACGGCCCGGC GTTTCTCCCC GGCTGGTTCT GGTTCGTCGC CAAGGTGTAC 
TTCCTGATCT TCTGCTGCAT GTGGATCAGG GCAACCTACC CGCGTTACCG CTACGACCAG 
CTCATGCGTC TGGGGTGGAA GGTGTTCCTG CCGCTGACCC TGGTCAACGT CATGGCGACC 
GGAATCTGGG TCATGGTCTT CAACAAGTAG

Protein sequence

MDTLILGLPV AYYIAMVAKV LVAFVFVLLT VAYATYAERK IIGHMQVRLG PMRTGWHGLL 
QPIADGVKLF FKEEIVPTQA SKFAFLIAPL VALIPAFISF AVIPFGAPVT IAGYTVPLQI 
AAYYDQAGQQ VFDVNVGVLY ILAMASLGVY GVVLAGWASN SKYSLLGGLR SAAQMISYEL 
AAGLAIIAVF MLSESLSLHK IVADQANGAW YVFKQPLAFV IFFICSLAEI NRTPFDLPEA 
ETELVSGFIT EYSSMKYAMF FMAEYANMIT VCAVTTTLFL GGWHGPAFLP GWFWFVAKVY 
FLIFCCMWIR ATYPRYRYDQ LMRLGWKVFL PLTLVNVMAT GIWVMVFNK