Gene TM1040_3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3744
Symbol
ID	4075451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	801317
End bp	803035
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	61%
IMG OID	638005264
Product	tetratricopeptide TPR_2
Protein accession	YP_611973
Protein GI	99078715
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGTAT CCTATCTCCG TTCTTTGACC TGCGCAGCCG CGCTTTTGCT GACCACCGGG 
CCGATGGCGG TGGCGGATGG GCTGGCGGGC GCGTATCTCG CTGGACGGGC CGCGACCTAT 
GAAAGCGACT TTGCCGCCTC CGCCAAATAT TACACGCGTG CACTGGTGCG CGATCCGCAG 
AACATCACCC TGATGGAGAA CCTCGTTTAT GCGCAGCTTG CGCTTGGAGA GGTCGAATCC 
GCGTTGCCGG TGGCAGAGCG GATGTGGCAG GCAGGTGTGA GCAGTCAGGT CGCCAATATC 
GTCATGGCAG GCAATCTTGC ACTGCAGGAA AACTATGACG CCCTGCTTGC ACGCGATTCC 
GAACAGTTTG AAATCAGCCC GCTGGTCGAC GGGCTGCTGG ATGCTTGGGC CTATATGGGC 
AAAGGCGCGG TCTCGCAGGC ACTCGACCAG TTCGACGCCG TGGCACAACA GGACGGGCTG 
CGCTTTTTTG CTTTGTACCA CAAGGCCTTG GCGCTTGCAT CGGTCGGAGA TTACGAGGGC 
GCAGACCAAC TGTTTGCCGC CAATGAGGGC CAGCTAGGCA GGTCCTCGCG CCGGGCTGCA 
ATCGCGCGGA TACAGGTCCT GTCACAACTC GGGCGCAACG ATCAGGCGCT TGAGGTGCTG 
GTCGACAGCT TTGGCGAAGG CTTCGACCCT GCGCTTACGG AGTTTGCAGA TCAACTCGCC 
ATGGGAGAGA CCTTACGGTT CTCGATTACC CCGACCGCAC GCGATGGCAT GGCAGAGGTG 
TTCTACAGCC TTGGTCAGGC GCTTTCGGGC GAGGCAGCGA GTGACTATGT GCTGATGTAT 
GCACGCATGG CCGCAAAACT CAGCCCCGGC CATGTGGATG CCGTGCTTCT GAGCGCGGGG 
CTTCTGGATC AAATGGGTCG TTACGAACTG TCGATCGCCA CCTACAAGCA GGTGCCGCGT 
GATCACCCTG ATTTCCATGC TGCCGAGCTT GGTCGTGCCG AGGCGCTGCG GCGATCGGCC 
AATCCGCAGG CCGCCGCCGA AGTGCTGGAA CAACTGGCGC GCGATTTCCC GCAGCATGTC 
GCGGTCTATA TCGATCTGGG CGACCTTATG CGGCAGCAGG AAAACTATGC CGAAGCCGCA 
AAGGCCTATA CCCGCGCGCT CGAACTGAGC CCCGATGAGA CAACGAACCG CTGGTTCCTT 
TATTATGCGC GCGGCATCTG TAACGAACGT CTGAAGAACT GGGAGGCGGC CGAGGCGGAT 
TTTCGCGCCG CGCTTGAGAT CGACCCGGAC CAGCCCCAGG TTCTGAACTA CCTAGGCTAC 
TCCCTTGTGG AGCGGCAGGA AAAACTGGAC GAGGCACTTT CCATGATCGA GCGTGCCGTC 
GCTGCGCGCC CCGAGAGTGG CTATATCATC GACAGCCTTG GATGGGTTCT TTACCGGATG 
GGCCGCTATG ACGAAGCCGT CGGTCACATG GAACGCGCAG TCGAGTTGAT GCCCGTGGAT 
CCGGTGGTGA ACGATCACCT CGGAGATGTC TATTGGGCGG TTGGGCGCAA GCTGGAGGCC 
GAGTTCCAGT GGCGGCGCGC GCTTTCCTTT GTGGAGCCCG AGGATAAGGA CGCCGAGGCC 
AACCCGGATC GCATTCGCCG CAAGCTCGAC GTTGGGCTTG ATGTGGTCCT GGCCGAAGAA 
GGGGCAGAAC CGCTTCAGGT TGCGAATGAC GATCACTGA

Protein sequence

MPVSYLRSLT CAAALLLTTG PMAVADGLAG AYLAGRAATY ESDFAASAKY YTRALVRDPQ 
NITLMENLVY AQLALGEVES ALPVAERMWQ AGVSSQVANI VMAGNLALQE NYDALLARDS 
EQFEISPLVD GLLDAWAYMG KGAVSQALDQ FDAVAQQDGL RFFALYHKAL ALASVGDYEG 
ADQLFAANEG QLGRSSRRAA IARIQVLSQL GRNDQALEVL VDSFGEGFDP ALTEFADQLA 
MGETLRFSIT PTARDGMAEV FYSLGQALSG EAASDYVLMY ARMAAKLSPG HVDAVLLSAG 
LLDQMGRYEL SIATYKQVPR DHPDFHAAEL GRAEALRRSA NPQAAAEVLE QLARDFPQHV 
AVYIDLGDLM RQQENYAEAA KAYTRALELS PDETTNRWFL YYARGICNER LKNWEAAEAD 
FRAALEIDPD QPQVLNYLGY SLVERQEKLD EALSMIERAV AARPESGYII DSLGWVLYRM 
GRYDEAVGHM ERAVELMPVD PVVNDHLGDV YWAVGRKLEA EFQWRRALSF VEPEDKDAEA 
NPDRIRRKLD VGLDVVLAEE GAEPLQVAND DH