Gene GSU1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1147
Symbol
ID	2685521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1237961
End bp	1238998
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	61%
IMG OID	637125821
Product	hypothetical protein
Protein accession	NP_952200
Protein GI	39996249
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.966903
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGCCT TTTGCCTCTG CTCGACCGGC CCTGTCGCAG CGGCCGAGCT TTCCCGCGGC 
CCGCAGGCGG AAGTTACCGT GGCTTACCAG CCGCTGGCCT CGCCGGGGGG GATAATCGTC 
CAGGCAATGC AGCACGATCG CATCTTGCGA CGCGAACTGG CCCGGAGGGG GATGTCGCTC 
CGATTCGTCG CCGCCGGCAA GGGGGGCGAT GTCATTCCCA TGCTCCAGAA GGGGGATGCC 
CACTTTGCAA CCATGGCCGA TATGCCTCTT ATCGAGGCGG TCAACGTCGT CCCCCTGTCC 
ATTATCGGTC AGCTCAAACG GAATTACGCC ATGGTTGTGG GCCCTCGCGG GCTGTCGGCG 
AAAGACTTGA AGGGAAAGCG GATCGGGAAC GCATTTGCGA CGACCGGCCA CTTCGCCCTG 
CTGAAGGTCC TCTCCAGCGC CGGCCTTTCG GAGCGCGATG TGGCTCTTGT TCCCCTTGAT 
GTAAACCTGA TGCCCGATGC GCTACGGAAC GGCCACGTCG ATGCGTTTGC CGCCTGGGAA 
CCCACCCCGT CACTTACCAT CGGCAGGAAC CCGGATCGCT ACGGCGCCAT CGGCCGGCAG 
CAAAGCATCT CGTTCCTTGT TTCCACAAGG GAGTTCACCG CTCAGCATCC CGAGGCTGCC 
AGGCAGGTCG CTGCCGCGCT GGTGCGGGCG ATGCACTGGT TCAAAGTTGA CCGGTCCCAT 
GTCATTACTG CGGTCAGATG GAACATCGCA GCAACTGAGG CATTGACCGG AGCCAAACCC 
CAAGTGGGCG AGCGGGAGTA TGCAAAAAGC GCCAGAGCCG ATCTGGAAGA GCTCGGCTAT 
TCGCCCAAAA TGTCCCGCTC TCTAACCAGT AAGCGATCCC TCCTTCTGGA TGCGCAGGAG 
TTCCTCAAGT CAATCGGCAA GGTGCCCCGT GCCGCCGCTG AGGATGCTCT CATCGGCAGT 
TTTACCTACG ATATTGTCGA GGATGTGATG AAGAAGCCGA CACAGTATTA CCTCTCCCGC 
TTCGACTATG CGCCGTAA

Protein sequence

MSAFCLCSTG PVAAAELSRG PQAEVTVAYQ PLASPGGIIV QAMQHDRILR RELARRGMSL 
RFVAAGKGGD VIPMLQKGDA HFATMADMPL IEAVNVVPLS IIGQLKRNYA MVVGPRGLSA 
KDLKGKRIGN AFATTGHFAL LKVLSSAGLS ERDVALVPLD VNLMPDALRN GHVDAFAAWE 
PTPSLTIGRN PDRYGAIGRQ QSISFLVSTR EFTAQHPEAA RQVAAALVRA MHWFKVDRSH 
VITAVRWNIA ATEALTGAKP QVGEREYAKS ARADLEELGY SPKMSRSLTS KRSLLLDAQE 
FLKSIGKVPR AAAEDALIGS FTYDIVEDVM KKPTQYYLSR FDYAP