Gene GSU1772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1772
Symbol	ctpA-2
ID	2686575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1935660
End bp	1936991
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	637126452
Product	carboxy-terminal processing protease
Protein accession	NP_952822
Protein GI	39996871
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.011127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAAGA CCATCAAAGG TAAACGCGTC GCACTGTTGC TTGCCTCGCT TTGTGTTGTT 
GCCGTGCTCG GTGCCGGTGC CGTTCAGAAG CGGTGCGCAG CTGAGGGAGG GAACGATTAC 
GAGTCCATCG AGCTCTTCAC TGATGTGTTG GCGATCGTCA AGAAAAGCTA TGTTGAAGAG 
GTGGACACCA AGAAGCTCAT CTACGGAGCC ATCAACGGTA TGCTTGCTTC ACTTGATCCA 
CACAGCTCCT TCATGCCTCC CGACATGTAC AAGGAGATGA AGATCGATAC GAAGGGGTCT 
TTCGGCGGCC TGGGTATCGA GATTACGATC AAGGATGGAC TCCTCACGGT AATATCCCCC 
ATAGAGGACA CTCCTGCCTT CAAGGCCGGC ATCAAGGCGG GAGATCAAAT CTTGAAAATC 
GAAGACCGCT TTACCAAGGA CATGACCATC ATGGATGCGG TCAAGAGAAT GCGGGGCCCC 
AAGGGGACGA AAGTAACCCT TACCATTATG CGTGAAGGTT TCGACAAACC GAAGGAATTT 
ACGCTCGTTC GCGATACCAT TCAGGTCAAG AGCGTGCGGT TCAAATCGAT GGATCAGGGG 
TATGGTTACA TAAGAATCGC ACAGTTCCAG GAAAAGACGG ACGATGACCT GGTCAAGGCG 
CTCAAGGCAC TCAAGGAAGA GAATGGCGGA GATTTGAGGG GACTCGTCCT CGACCTCCGT 
AACGATCCGG GCGGACTTCT CGATCAGGCT GTCAAGGTTG CCGATCACTT TGTCGAAGAT 
GGACTCATTG TGTACACGGA GGGGCGTGAG AAGGAGTCGC GGATGCAGTT TACCGCCCGC 
AAGTCCGGCA CTGAACCCAA CTACCCGATG GTTGTGCTGA TCAACAGCGG AAGCGCCAGT 
GCTTCTGAAA TTGTCGCTGG TGCGCTGCAG GATCATAAGC GTGCCGTTGT CATGGGGACC 
CAGAGTTTCG GGAAAGGCTC GGTCCAGACA ATCATCCCCC TCTCCGATGA GTCTGGTCTC 
CGACTCACCA CGGCACGGTA TTTCACGCCG AGCGGTCGTT CCATCCAAGC CAAGGGCATA 
ACGCCGGACA TCGTTGTGGA GCGCGCGGAA ATCCAGTCTA CAGAGAAGAT GGAAGGCCAT 
ATCCGCGAGA AAGACCTTGA GAATCATTTC GATTCCGACT CGAAGGACGG ATCGGACAAC 
AAACAAAAAG GAACAGATAA AGGTGCTTCG GCAGCATCCA AGGTCGATGA GCAGTTGAAG 
AGCGATTATC AGGTGATGCG CGCGCTGGAT CTCCTGAAAG GGTGGGAAAT CCTGAAAACA 
ATAAGCAAAT GA

Protein sequence

MFKTIKGKRV ALLLASLCVV AVLGAGAVQK RCAAEGGNDY ESIELFTDVL AIVKKSYVEE 
VDTKKLIYGA INGMLASLDP HSSFMPPDMY KEMKIDTKGS FGGLGIEITI KDGLLTVISP 
IEDTPAFKAG IKAGDQILKI EDRFTKDMTI MDAVKRMRGP KGTKVTLTIM REGFDKPKEF 
TLVRDTIQVK SVRFKSMDQG YGYIRIAQFQ EKTDDDLVKA LKALKEENGG DLRGLVLDLR 
NDPGGLLDQA VKVADHFVED GLIVYTEGRE KESRMQFTAR KSGTEPNYPM VVLINSGSAS 
ASEIVAGALQ DHKRAVVMGT QSFGKGSVQT IIPLSDESGL RLTTARYFTP SGRSIQAKGI 
TPDIVVERAE IQSTEKMEGH IREKDLENHF DSDSKDGSDN KQKGTDKGAS AASKVDEQLK 
SDYQVMRALD LLKGWEILKT ISK