Gene GSU1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1959
Symbol
ID	2688250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2148200
End bp	2149210
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	57%
IMG OID	637126650
Product	hypothetical protein
Protein accession	NP_953008
Protein GI	39997057
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGGGCGC ACTGTAGCGC CATTGCCCGG ACCATGGTCT ACCCCAGCTT CTTTTGCAGC 
GGTGACTGGT TAAAGGTTGC GGCGGAGAAT CTGTGCCCGG GGGACGAAGC GTATATCCTT 
CTGGCCAAAG ATGCCGACGA CATCCGGGGG GTGCTCCCCC TGGTCAGAAA GCGCAACGCC 
CTCGGAGGTA CCGACCTGCA CTACCTGGGC TCGGATTTTT ATCCCGATCC GCTTGGCCTG 
ATCTGTTCGC CTGCCGATCG GGCCGATTGT GCCGCTGCCC TGAGAAACCA TCTACTCAAT 
GCCCCCGATT GGGACCGATT GATACTGGAC TTTCTGCTGG AGGACGAACC GGCTGATTGG 
ACTCTGCCCG GCAAGCCGGT TTCAGTGGCG CCGTTTAAAG TGCTGCCACG GGACTTTTCC 
GAGCTGCTGG GAGAGTTCAA GAAGAAAAAG CGCTACAACC TGAGAGCGAT GGTGAAAAAG 
CTCCTTGATG CCGGTGGAGA GCTTGCTGCT TCTTCGGGGC CGGAATCGAA CATAGCGTAT 
CTGGACGCCT TGTTTTTCCT GCATGAGAAA AGGGCGAGCG AAAGGTCGCT GGACAGCAGC 
TTCACTGGAC CGAGGGTGCA ATCGCTCCAC CGAGCCCTTG TTGCTGCGTC GGATAATGTG 
AGGTTTTTCG GACTCAGGCT CAATGGGCAG ATGATAGCTG TGATCTACGG CTTCGAGTTC 
TGCAATCGCT TTTTCTACTA CCAGGTGGCC CACGACCCGG ACCATGGCCA CCTCAGCCCG 
GGGACGGTGC TGCTCTATCT CGTGATTGAA GCCTGTTGCG TCAACGGACT GACGGAATTC 
AACTTCCTCC AGGGAGATGA AACCTATAAA GGCATCTGGA CCAACGATTC GAGGATACTC 
TATCGCTGCG TACTCAATCG AAGCACGTGG CGCTCCCGTG TGTTCAGCGC CGTGGAGGAA 
TCCAGAGGTT ACGTCAAGCG GGCAATGGGG TTGATGTCTC GTGGGAATTA A

Protein sequence

MWAHCSAIAR TMVYPSFFCS GDWLKVAAEN LCPGDEAYIL LAKDADDIRG VLPLVRKRNA 
LGGTDLHYLG SDFYPDPLGL ICSPADRADC AAALRNHLLN APDWDRLILD FLLEDEPADW 
TLPGKPVSVA PFKVLPRDFS ELLGEFKKKK RYNLRAMVKK LLDAGGELAA SSGPESNIAY 
LDALFFLHEK RASERSLDSS FTGPRVQSLH RALVAASDNV RFFGLRLNGQ MIAVIYGFEF 
CNRFFYYQVA HDPDHGHLSP GTVLLYLVIE ACCVNGLTEF NFLQGDETYK GIWTNDSRIL 
YRCVLNRSTW RSRVFSAVEE SRGYVKRAMG LMSRGN