Gene GSU1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1105
Symbol	pepQ-1
ID	2688567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1190621
End bp	1191814
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	58%
IMG OID	637125774
Product	xaa-pro dipeptidase
Protein accession	NP_952158
Protein GI	39996207
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.071673
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATCA CACCAAGGGA AGAGTTGGAC TACCGCATCT CCCGGCTTCA GACATACATG 
GCCGGGGCAG GGCTCGATGC GGTCATCATC GTTCAGAATG CCGACTTGTT TTATTTCACC 
GGCACCATCC AGAGCGGCAA CCTCTATGTG CCCGTTGAGG GCGACCCCAT CTACATGGTC 
CGCAAAGAGC ATTCCCGGGC GCGGATGGAG TCGGGGCTCA AGTTGGTCGT ACCGTTTTCC 
TCCATGAAGA ACATCCCCGG TATTCTGGCA GACCACGGTT ATTCTCTGCC CGCCCGGATC 
GGCATGGAGC TCGACGTCGT GCCGGTAGCC TTCTTTGAGC GCTACCGCGC CGTATTTCCC 
AACGCCGACT TCAGCGATGC AACGCCTCTC ATCCGGCGGG TCAGGATGAT CAAGAGCAAG 
TACGAGATTC ATCTCCTCCA GGATGCCGCA GTCCAGGTCG ACAAGGTCCA TCGTCGCGCC 
ATGGAGGTCA TCCGTGAGGG GATGACCGAT CTGGAACTTG CGGCGGAACT GGAGTTCACT 
GCCCGGAAAG AAGGTCACCA GGGGCTCGTC CGGATGCGCT CTTTCAATTC TGAGCTGTTT 
TACGCTCATA TTTTTTCAGG GACCGATACA GCGGTCCCTG CCTATGTGGA TACCCCCCTC 
GGAGGACTTG GGCTCAATCC CTCGTTCGGT CAGGGGGCCG GGCTCAAGCG GATCGAACGC 
AATGAGCCGA TCATCGTCGA TTTCGCCGGT TGCGTTGACG GCTACCTGGT GGACCAGACA 
CGCGTCCTGG CCATCGGAGG GATTTCCGAT CGGTTGCGTC GTGCATACGA TGACATGATC 
AGGGTTCAGG AGCGGATGAT CACGCTGGCT CTCCCCGGCA CGCCGTGGGG CGATGTCTAT 
GAGGGGTGTC GCACTCTGGC TGAGGAGCTG GGGTATGCCG ACAGCTTCAT GGGCTCCCGT 
GGCGCCCAGG TTTCCTTTAT CGGTCACGGC ATCGGCATCG AGATAGACGA ATATCCGTTC 
ATTGCGCGTG GCTTCTCCGA AATGGTCCTT GAGCCGGGCA TGGTTTTCGC TTTCGAGCCG 
AAGGTCGTTT TCCCGGGCGA AGGAGCCATC GGGATCGAAA ATACCTTTTA TATCTCAAAC 
TATGAAGGGC TCAAGCAGCT GACATTCTCG GACCAGGAAC TGGTCATTCT CTGA

Protein sequence

MRITPREELD YRISRLQTYM AGAGLDAVII VQNADLFYFT GTIQSGNLYV PVEGDPIYMV 
RKEHSRARME SGLKLVVPFS SMKNIPGILA DHGYSLPARI GMELDVVPVA FFERYRAVFP 
NADFSDATPL IRRVRMIKSK YEIHLLQDAA VQVDKVHRRA MEVIREGMTD LELAAELEFT 
ARKEGHQGLV RMRSFNSELF YAHIFSGTDT AVPAYVDTPL GGLGLNPSFG QGAGLKRIER 
NEPIIVDFAG CVDGYLVDQT RVLAIGGISD RLRRAYDDMI RVQERMITLA LPGTPWGDVY 
EGCRTLAEEL GYADSFMGSR GAQVSFIGHG IGIEIDEYPF IARGFSEMVL EPGMVFAFEP 
KVVFPGEGAI GIENTFYISN YEGLKQLTFS DQELVIL