Gene GSU1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1899
Symbol
ID	2686215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2076665
End bp	2077714
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	56%
IMG OID	637126590
Product	virulence factor Mce family protein
Protein accession	NP_952948
Protein GI	39996997
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTTGT CGACTGAAAA GAAGGTGGGT TTTTTCTTCA TGGCCGGATT GGTGGTCCTG 
GGGGTGATGC TCGAATTGGG CGAGCGGTGG AACCCCTTTG AGAAGAACCT TCCCTATGTG 
ACCTATCTTT CGAGCACCAC CGGCCTCAAG GTGGGAGACC CTGTTCGGCT GGCTGGCGTT 
GAGGTCGGGA AGATTACCCG GATCGATATC GAGGACGGCA GAGTGAAGGT CGGTTTCGAG 
GTCAAACCCG GGACCCGGAT CAAAACCGAC TCGGTGGCGA CCATCCGGCT TACGAACCTT 
CTGGGGGGAC AGTTTCTGGG GATTTCCTTT GGTACCCAGA CCGCCGACAT CCTTGCCCCG 
GGCTCTGAGG TGAAGAGCCG GGAAATTGCC AATATCGACA TCATTGTCGA CAACGTGAGC 
GACCTGACCA AGGACGCGCG GACGTTCCTC AATGATCTGA ACACCAACCA GAACGAGGTC 
CTGGGAAAAA TCTCGACCAT GCTCGACGAG AACAGGGGGA ACCTCAAGGG GGCGGTCCAG 
AATCTCAACA GTATCACCGC AAAGATGGAC CGTGGCGAAG GCTCGCTTGC AATGCTGCTG 
AATGACAAGG CCCTCTATCA AAACACCAAT GAGCTTGCCA CGAGCCTTAA GACCGTCACC 
GGGAAGATAG AGCGTGGCGA GGGTTCGCTG GGCAAGCTGG TAAACGAGGA TGCTCTGTAT 
GTCGAAGCTA AGGGAGCGTT GGCTGAGTTG AACGCGGGCG CAAAAGATAT CAAGGAAATC 
GCCGCCAAGA TCAACAAGGG TGAGGGGAGC GTCGGCAAAC TCGTTCATGA CGAGGCTCTC 
TATAACGAGC TGCGTGACGC ATCCAAAAAC ATCAGTGACG TGGCGCGCAA AATCAACGAA 
GGGCAGGGCA CCCTTGGCAA GCTGGTGAAC GACGACAAGC TCTACCGTGA TACAGCCGCA 
GCCATGAAGA AACTGGACAA GGCAGCCGAC GGGCTCTCCG ATTCGGGGCC GATTTCGGTG 
CTTGGAAGTG TTGTCGGTAC GCTGTTTTAA

Protein sequence

MALSTEKKVG FFFMAGLVVL GVMLELGERW NPFEKNLPYV TYLSSTTGLK VGDPVRLAGV 
EVGKITRIDI EDGRVKVGFE VKPGTRIKTD SVATIRLTNL LGGQFLGISF GTQTADILAP 
GSEVKSREIA NIDIIVDNVS DLTKDARTFL NDLNTNQNEV LGKISTMLDE NRGNLKGAVQ 
NLNSITAKMD RGEGSLAMLL NDKALYQNTN ELATSLKTVT GKIERGEGSL GKLVNEDALY 
VEAKGALAEL NAGAKDIKEI AAKINKGEGS VGKLVHDEAL YNELRDASKN ISDVARKINE 
GQGTLGKLVN DDKLYRDTAA AMKKLDKAAD GLSDSGPISV LGSVVGTLF