Gene TM1040_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1952
Symbol
ID	4076902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2055091
End bp	2056218
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	60%
IMG OID	638007267
Product	tetratricopeptide TPR_2
Protein accession	YP_613946
Protein GI	99081792
COG category	[S] Function unknown
COG ID	[COG5616] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.106367
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0284663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCTTTC GCGTCCTTCA CTTTGCCGAG CCCGAAGAGA CGGTCTTTGC CGAGGGCATC 
TCGGAGGACA TCACAACCGA GCTATCGCGG TTTCATGCCA TTCGGATCAC ATCCCGGATG 
TCGTCCTTTC AGTTTAATGC CTCAGAGCGA CCAGCTCAGG AGATCGCAAC AACGCTCGGG 
GCGGACTTCA TTCTGTCAGG AACGGTGCGC CGCGCATTGA ACCGTATCCG AGTCGTGGTC 
GAACTCTATG AGACGCTGGA AGATCGGCAA ATCTGGTCCG AGCGCTTCGA CCGTGCCGAC 
GCCGACATAT TCGCGGTCCT CGACGAGATT TCCGGCCTTG TCGCTGCCTG CATGACAGGC 
GAGGTTCAAC TGGCCGAGAC CCGGCGGACA AAGGCCAAAG CCGGCCAAGA CCTAACCGCC 
TATGAGGCGC TTCTTGTCGG GCAGGACCTG CACAAAAGCG GTGATATCAG CCCACGCGTG 
GCCACACGTG CGGTCGCAGC CTTTTCAGAG GCGATCGACG CGGCGCCCGA CTTTGCACGC 
GCCTACGCCT GGCGGGCCTG TTCCTTCTCA CGCACGTGGG ATTTCCCGGT GCGGCAAGAT 
CAGTTCGATC AGGTTTCACA GGATGTCTTC AAGGCGCTGG AGTTCGACCC GGCAGAGGCG 
GAGGCTCATC GTATCGCAGG CGCCGTCTGT CGTGCGCTGC ATGAGTTTGA CCGCGCGACT 
TTGCATATCG AAAAGGCGCT CGAGCTTAAT GCGAGTGATG CCCATATCGC CGCGAAATCG 
GCCGAGCATT TTGCGTTTAT CGGACAGCCC CAGCGCGCGC ATGACCTCAT CAACAAGGCG 
ATGGCGCTCA ACCCGATGTT CTCGGGCTGG TACTGGGAAA TTATTGCCCT CGCCGACTAT 
GTGGCGAGCC AATATGAGGA GGCGCTTGCC GCAATCACGC GCGCTGCGAG CCCGACATTC 
GCCGGGTTTG CCTATCAGGT AGGCTCCCTC TTGGCGTTGG GCCGTACCGA GGAGGCCAAA 
GAAGCGGTTG CGCTTTTGAA AGCGCAATAT CCAGACGTGA CGCTTGCCGT TTATCAGCGC 
GACGGGCGCC GCTTTGCCTT TGCAGACGGC CAACCACAAA AGGTTTGA

Protein sequence

MPFRVLHFAE PEETVFAEGI SEDITTELSR FHAIRITSRM SSFQFNASER PAQEIATTLG 
ADFILSGTVR RALNRIRVVV ELYETLEDRQ IWSERFDRAD ADIFAVLDEI SGLVAACMTG 
EVQLAETRRT KAKAGQDLTA YEALLVGQDL HKSGDISPRV ATRAVAAFSE AIDAAPDFAR 
AYAWRACSFS RTWDFPVRQD QFDQVSQDVF KALEFDPAEA EAHRIAGAVC RALHEFDRAT 
LHIEKALELN ASDAHIAAKS AEHFAFIGQP QRAHDLINKA MALNPMFSGW YWEIIALADY 
VASQYEEALA AITRAASPTF AGFAYQVGSL LALGRTEEAK EAVALLKAQY PDVTLAVYQR 
DGRRFAFADG QPQKV