Gene Glov_0144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Glov_0144
Symbol
ID	6368661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter lovleyi SZ
Kingdom	Bacteria
Replicon accession	NC_010814
Strand	+
Start bp	134137
End bp	135267
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	61%
IMG OID	642675543
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_001950400
Protein GI	189423223
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGT TAGGGCATTT TTTCGGCAGC GGGATCAGCC GCCGGGATTT TATCAAGACC 
TGTGTGGCAA CAACGGCAGT CATGGGGCTG CCTTTCAGCA TGGCTGCCAA GGTGGCGGAA 
GCCGCCCAGG CACCGGATCG GCCGCCGGTG ATCTGGCTGC ATTTTCAGGA GTGTACCGGC 
TGTTCTGAGT CGCTGCTGCG GGCCAATCAC CCAGCTCCAG CCACCCTGCT GTTGGAGATG 
ATCTCGCTGG ACTACCACGA GACCCTGATG GCCGGCTCCG GCCACCAGGC TGAGAAGTCG 
CTGCACGACT CCATGAAGGC CAATCATGGC AAGTATATCC TGATCGTGGA AGGGGCGATC 
CCCACCAAGG AGAACGGCAT CTACTGCAAG GTGGGTGGCA AGACCGCCCT TGAGTCCCTG 
CGTAAGGCAG CCGAGGGGGC AGCCGCCATT ATCTCGGTCG GTACCTGCGC CAGCTACGGC 
GGTATCCAGG CTGCCCCGCC CAACCCCACC GGCGCTGTGG GGGTGCGGGA TATCATCAAG 
GACAAGCCGA TCATCAACAT CCCCGGCTGT CCGCCTTCCC CCTATAACCT GCTTTCCACC 
GTGCTGTATT TCCTGACCTT TAAGAAACTG CCGGAACTGG ATCAGATGGG CCGTCCCAAG 
TTTGCCTATG GCCGCCGGAT TCACGAACAT TGCGAGCGCC GTCCCCACTT TGATGCGGGA 
CGTTTTGCCA AGGACTATGG CCATGAGACC CATGCCCAGG GCTACTGCCT CTACAAGCTG 
GGTTGCAAGG GTCCGGCCAC CTATGCCAAC TGTTCGGTAC AGCGCTTTAA CGATGCCGGG 
GTCTGGCCGG TCTCGGTGGG CCACCCCTGT ATTGGCTGTA CCGAGCCGGA TATTCTGTTC 
CGTACCGCCA TTGCCGACAA GGTCCAGATC CACGAACCAA CGCCGTTTGA CAGCTATGCG 
CCGGTGGATC TGAAGGATAA GGGCAAAGGG GCCAGCCCGG TTACCACCGG TGTGCTGGGC 
TTGGCAGCCG GGGCCGCCCT GGGGGCCGGG GCCATGCTGG CCCGCAAGCT GCCGGATGCG 
GAGCAACCTG CTGAACATGA GCAGGGAGGC GACCATGAGC ACAAAGAGTA G

Protein sequence

MSQLGHFFGS GISRRDFIKT CVATTAVMGL PFSMAAKVAE AAQAPDRPPV IWLHFQECTG 
CSESLLRANH PAPATLLLEM ISLDYHETLM AGSGHQAEKS LHDSMKANHG KYILIVEGAI 
PTKENGIYCK VGGKTALESL RKAAEGAAAI ISVGTCASYG GIQAAPPNPT GAVGVRDIIK 
DKPIINIPGC PPSPYNLLST VLYFLTFKKL PELDQMGRPK FAYGRRIHEH CERRPHFDAG 
RFAKDYGHET HAQGYCLYKL GCKGPATYAN CSVQRFNDAG VWPVSVGHPC IGCTEPDILF 
RTAIADKVQI HEPTPFDSYA PVDLKDKGKG ASPVTTGVLG LAAGAALGAG AMLARKLPDA 
EQPAEHEQGG DHEHKE