Gene GSU0853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0853
Symbol
ID	2687191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	912183
End bp	913517
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	61%
IMG OID	637125526
Product	CBS domain-containing protein
Protein accession	NP_951910
Protein GI	39995959
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.215802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAAG AATTATTGGT CATCTTTGTC CTGATTCTCG GCAATGGTTT TTTTGCCGGC 
TCGGAGCTTG CCATCATTTC CGCCCGCAAG GGAAGAATTG CCCAGCTGGT CGAAGCCGGC 
GACTCCCGCG CCCAGATTGT TGAACGACTC CAGAATGATC CGCACCGCTT TCTGGCCACG 
GTCCAGGTAG GGGTGACGGT GGTTGGCTCT CTTGCCTCCG CCGTGGGCGG CGCTGCGGCG 
GTGCAATCGG TCAAACCGCT GCTGGAGGCG GTTCCCGTCG ACTTCATCCG CCATGCGGCT 
GAGCCTCTGG CCATCGGCCT GGCAGTCGTA TTCATCTCCT ATCTCTCCCT CATCTTCGGT 
GAACTGGTCC CCAAGACCGT GGGACTCCAG TATGCTGATC AGATGGCGCT TCGCGTGGCC 
AAGCCGATCA GCTCCCTGGC AAAGGTCGCG GGAGTGGTGG TCAGCTTTCT CACCATTTCC 
AACAAGGCAG TGCTCGCCAT GATGGGGATC AAGGCCGAGG GGAGCCAGGC CTTCGTCACC 
CGCGAGGAGG TTCAGCACAT CGTTGCCGAG GGGCACGAGG CGGGGGTGTT CAGCGCCACC 
GAGCAGGAGT ACATCAGGAA CATCTTCGAT TTCACCCACA CCTGCGTCCG TGAGGTGATG 
GTGCCGCGCA CCCGCATGGT GGCGCTCGAT CTGGCGCGTC CCCGGATGGA GCTGGTCCGG 
GAGGTGCTGG ACAACATGTA TTCACGCTAT CCGGTTTACC GCGAGAGCAT CGAGAACGTC 
GTAGGCTTCA TTCATGGCAA GGATCTGCTG GGGAGGACCG TGACCGATCC GGAATTCGCC 
ATGGAATCGA TCGTCCGCCC TCCCTTCTAT GTGCCCGAAG GGAAAAAGGT CAACGAACTC 
CTCAAGGAGA TGCAGCGGCT CAGGATTCAC ATGGCGCTGG TAGTCGACGA GTATGGCGGC 
ATCAGCGGCC TGGTCACCAC GGAGGACTTG CTGGAGGAGC TGGTGGGCGA GATCGAGGAC 
GAACACGACA TCGGCGAGCC CGGGACCGTG CAGCGGCTGC CGGACGGCAG TCTGCTGGTG 
GACGCCCTCA TGTCGATCGG AGACCTGGCA GACCTGCTCA AGATCAAGCT GGAAGAGGAT 
GTGCCCTATG ACACCCTTGC TGGCCTCATT CTCGACCAGT TGGGACGCTT CCCCGAGCGG 
GGCGAGACGG TTGAATGGGA CCGCTTCAGC CTCATCTGCG AGGAGGTCAA GCAGACGGCG 
ATCGTCAAGG TGCGCATCGT GGAAAATCTG CCGCCCCAGG CGGGTGACGA ACAGTACGGA 
ACGGAGCACG AGTAG

Protein sequence

MIEELLVIFV LILGNGFFAG SELAIISARK GRIAQLVEAG DSRAQIVERL QNDPHRFLAT 
VQVGVTVVGS LASAVGGAAA VQSVKPLLEA VPVDFIRHAA EPLAIGLAVV FISYLSLIFG 
ELVPKTVGLQ YADQMALRVA KPISSLAKVA GVVVSFLTIS NKAVLAMMGI KAEGSQAFVT 
REEVQHIVAE GHEAGVFSAT EQEYIRNIFD FTHTCVREVM VPRTRMVALD LARPRMELVR 
EVLDNMYSRY PVYRESIENV VGFIHGKDLL GRTVTDPEFA MESIVRPPFY VPEGKKVNEL 
LKEMQRLRIH MALVVDEYGG ISGLVTTEDL LEELVGEIED EHDIGEPGTV QRLPDGSLLV 
DALMSIGDLA DLLKIKLEED VPYDTLAGLI LDQLGRFPER GETVEWDRFS LICEEVKQTA 
IVKVRIVENL PPQAGDEQYG TEHE