Gene GSU0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0133
Symbol
ID	2688035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	147502
End bp	148668
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	62%
IMG OID	637124800
Product	hypothetical protein
Protein accession	NP_951195
Protein GI	39995244
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.957824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTATTC TTTCAACAAC AACAGCCATA TGCCAGTTCC GGGTCGCGGG GGATCTCCCT 
GCCGGTGACC TCTATCCCTG GATTGCCGAA CATCTCGCCC GACAGGCCTT TCAGTCCATC 
GATCAAGGGG TCGCCGAGCA GTCCGTGGGG TGGGTTCATC TGGATGACCA TCGGCAGATG 
AGCTTCGACA TCCCCGCCGC CTTCTGGCGT GACCATTACG TGGCCTTCAC CCTGCGCCGC 
GACCAGCGCA AGCTTCCGGC GGCGCTGGTA AAGGCCTATC TTCAGGTGGC CGAGCATGAG 
TACCTCTCGG CCCATCCCGG CCTCAACCGG GTGCCCAAGC AGAAGCGCGA GGAGCTGAAA 
GAGGCGGTGC GCCTCAACCT CCTGGCCAAG ACCTTGCCGG TTCCCTCCAC CTGGGATGCG 
GTCTGGGACA CCCGCACCGG TATCGTCACC TTTACCTCCC TGTCGGCTCC CATTATCGAG 
CTGTTCGAGA CCCAGTTCAA GAAGACCTTC GAGGGGACGC GCCTGGTGGC GATCCATCCC 
TATGCCCGGG CAGAGGCCGT GGGAGGCGAA GGGCTGAAGC CTGCCCTCGA ACAGGCCAAC 
CTCGCCACGA GCGATGCCGC CATCGATCTG ATCAGGAGCA ACCAGTGGCT CGGGTGGGAT 
TTCCTCCTCT GGCTTCTCCA CCGGACCATG ACCGATTCTT CCGAGTACTG CGTGGGGCAG 
CCCGGCCCGG CTCTGGCAGG CGAGCCCTTC GTGGCTTACC TGAACGATCG CCTGGTCCTC 
GTGAGCGCCG GGGAGGCAGG AACCCAGAAA ATCACCGTGG CCGGTCCCCA GGACCACTTC 
CGAGAAGCCC GCACTGCCCT TGCCCACGGC AAGCGGATCA CCGAATCGAC TCTCTACCTG 
GAAAAGGAGG AGCATGTCTG GAAGTTGACC CTCAAGGGGG AACTCTTCCA TTTTGCTTCC 
CTCAAGTCCC CCAAGGTGGC CATCGAAAAG GGCGAGCACG TGGACGAAGG GAGCGAACGG 
GAAGCGGCCT TTTACGAGCG GATGTATGTT CTGGAACAGG GACTCCAGCT CTTCGACAGC 
CTGTACGGCG AATTCCTCAC GGTGCGTCTG GGTGCCGGAT GGGGCGAAGA ACTGGCTCGG 
ATCGAAGGGT GGCTGGCAGG GGAGTAA

Protein sequence

MGILSTTTAI CQFRVAGDLP AGDLYPWIAE HLARQAFQSI DQGVAEQSVG WVHLDDHRQM 
SFDIPAAFWR DHYVAFTLRR DQRKLPAALV KAYLQVAEHE YLSAHPGLNR VPKQKREELK 
EAVRLNLLAK TLPVPSTWDA VWDTRTGIVT FTSLSAPIIE LFETQFKKTF EGTRLVAIHP 
YARAEAVGGE GLKPALEQAN LATSDAAIDL IRSNQWLGWD FLLWLLHRTM TDSSEYCVGQ 
PGPALAGEPF VAYLNDRLVL VSAGEAGTQK ITVAGPQDHF REARTALAHG KRITESTLYL 
EKEEHVWKLT LKGELFHFAS LKSPKVAIEK GEHVDEGSER EAAFYERMYV LEQGLQLFDS 
LYGEFLTVRL GAGWGEELAR IEGWLAGE