Gene GSU1122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1122
Symbol
ID	2686869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1206510
End bp	1207637
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	59%
IMG OID	637125791
Product	HD domain-containing protein
Protein accession	NP_952175
Protein GI	39996224
COG category	[R] General function prediction only
COG ID	[COG3481] Predicted HD-superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGCAAGA TTTTCATAGC GAGCATCCAT GACCGCGATC TGGTCGATTC CGTGTTTCTC 
GTGAAGGAAA AGATCATGGC CATGGCCAAG AACGGCAAGC CCTACATGAC GCTTCGGCTC 
ATGGACAAAA GCGGCGAGAT AGAGGGGCGT GTCTGGGACA ACGTTGACCA GCTGTCGGCC 
TCCTTCGATA AGGACGACTT CGTTGGCGTC CGCTCCAAGG CATCGGTCTA CCTGGGCAAA 
ATGCAGCTTA TCATTTCCGA GCTGGTGCGG GTTCCCGAAG ACAGGGTCAA CCTGGCGGAC 
TTTCTCCCCG AATCGGACCG CTCCATTGCC GAGATGGAGA GCGAGCTCAA GGCCCTGGTG 
GAAACCTTTT CCGATCAGCA CCTGAAAGCG CTGATGAAGG CCTTTTTCGA CGATTCTTCC 
TTCATGGAGC TCTACCGGAC CGCGCCGGCC GCCAAGGGGA TGCACCACGT CTATCTGGGT 
GGACTGCTGG AGCACTCACT GGCCGTGTCC CGCCTGGTTG ACGCCATCGT CCCCCTCTAC 
GCGGATCTCA ACCGCGATCT GCTGGTGGCG GGTGCCCTGT TGCACGACGT GGGCAAGGTG 
CGGGAGATGA CGTACCTGCG TTCCTTCGAC TACACCGACG AGGGGAAACT CATCGGCCAT 
ATCACCATCG GCGTGGAGAT GCTCCAGGAG CGGATTTCGA CCATTCCCGG CTTCCCGCCG 
GAGCTGGGGA TGCTGCTCAA GCACATGCTG CTGTCCCACC ATGGTCAGTA CGAATACGGT 
TCCCCCAAGC GCCCCAAGAC TGTCGAGGCA ACGATTCTCA ACTACCTGGA CGATCTGGAC 
TCCAAGATCA ACGGGATCAG GACCCATATC CGCAAGGAAA GCGAAAACCT GGGGCGCTGG 
ACCTCCTATC ACCGGCTCTA TGACCGCTAC TTCTACAAGG AGAGCTACAG CGGCGAGGAG 
GAATACCGGG AAGGGGCGGA TGAGCTCATG GTGCTCGAGC CGGAGCCGGT ATCGCTGCCG 
GCTGCCCCTC GGGCCGCGGA GGCCGAGCGC AAAAGCGGCA ACACCGCCCG AAAGGGGTTC 
AGCAACAATC CGTTCGAGAC CCTGCAAAAG AATCTGGATC TGTTCTGA

Protein sequence

MSKIFIASIH DRDLVDSVFL VKEKIMAMAK NGKPYMTLRL MDKSGEIEGR VWDNVDQLSA 
SFDKDDFVGV RSKASVYLGK MQLIISELVR VPEDRVNLAD FLPESDRSIA EMESELKALV 
ETFSDQHLKA LMKAFFDDSS FMELYRTAPA AKGMHHVYLG GLLEHSLAVS RLVDAIVPLY 
ADLNRDLLVA GALLHDVGKV REMTYLRSFD YTDEGKLIGH ITIGVEMLQE RISTIPGFPP 
ELGMLLKHML LSHHGQYEYG SPKRPKTVEA TILNYLDDLD SKINGIRTHI RKESENLGRW 
TSYHRLYDRY FYKESYSGEE EYREGADELM VLEPEPVSLP AAPRAAEAER KSGNTARKGF 
SNNPFETLQK NLDLF