Gene TM1040_1421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1421
Symbol
ID	4078051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1516976
End bp	1518391
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	59%
IMG OID	638006731
Product	tetratricopeptide TPR_2
Protein accession	YP_613416
Protein GI	99081262
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0844206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0579144
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGTAG AAAACAGCCA TACTCCCGAT GCCTTGGCTG AGGCATTTGC AACCGTCGAC 
GGTCTTATGG CCACGGGCAA ATTTGCACGC TCTCTCAGCG TGATGCTGCC TTTTGTTCAA 
ACAGGTGAGC TGGATGCTGG CCTGCTGGAT CGCACCGCCG ATTGCTTCTT TGAAATGCGT 
GACTACGAGA ATGCGGTAAA CGTCATGCGC CATGTCACTG CAACCTGGCC CGATGATCCC 
TCCGCATGGG GCAAGCTTGG CCTGATGCTG CAAACCAAGG GTGATCTCCT TGGTGCCGAG 
CAGGCCTTTG AGGAAGTGCT GAAGCGCGAT CCCAATTCGA TCCCGGCGCT GACTGCGCTC 
AACGGGATTG AGACATTTTC CGTCGACAGC CTCTATGCCC AGCGCCTGAT GTCGCTCTCC 
GAGCGTGAGG ATCTGGATGC CAAACACCGT GCCTTGATCC ACTATGCGCT GGCCCAGATC 
GCCCATGGGT CGGGCGAGGC AGAGGTCGCA TTTACGCTGT TCCAATCTGC GCGCAACGAG 
GTGGCCGGTC CTTTTGCGCC TGCGATTTTC GACGAGATGG TCGCCGAGCA AGAAGCCTTG 
TTTGAACCGC GCCCGGCCTC TGAGGATGCG TCGCTGCTGC CCAAACTGGT CTTTATCGGC 
GGTATGCCGA TGTCTGGCAC CGGTCTGGTG GATCGAATTC TCGCACAGCA CCCTGGCGTG 
TTCAGTGTTG GCGCAAAAAC GGCGCTCTCG CGCACCCATG GTGCCATCCG CATGCATCTC 
GCCAAGACCG ACCGTCCCTG CAACTACTGG GATTGGATGG AGCATCTGAG CGCAGAAGAA 
ATCGACATCT TCCGTCAGTA CTACCTCGAG CGCGCCCTCG GCGGTCAGGT GGCTGGTGGC 
AAGACCATTG TTGACGCGCA TCCGCTGGGA TGTCTGGAAT TCGGCCTTGC ACAATTCCTC 
TTCCCCGAGG CCAAATTTGT CTTCATGTCG CGTCACCCGA TGGACACGGC GCTGGCCAAT 
ATCGCGTCCA ACGTGCTGAA CGGCAATGCG CTGGCATCGC GTACCGAATG GATCGCGCAG 
GTGATGCGCA CGGTCTATTC CTCGGCAACC GTCTATGCTT CCAAACTTGG CGACAGCATG 
CGCCTGCAGT CCTACGAGGC GCTGGTGCAA AACTCCGAGC GTGAAATCGG CCTCCTCTTG 
GAGCATGCGG GTCTTGAATA CAACGCCGCA TGCCTCACAC CAAATGCGCT CTGTGACGTG 
CCGCAGATTG CGACCATGCT TGGTCAGGAA GAGCTCTCGA CTGAGACGCA GAACCAGTGG 
CTCCCCTATG AGGAGCAGCT GCAGGGGTTC TACGAGCAAC TGGGCGGCGA ACGCTGGGTC 
TCTGCTTGGG AAGATTTCGA CAAGACGCTG CGCTGA

Protein sequence

MLVENSHTPD ALAEAFATVD GLMATGKFAR SLSVMLPFVQ TGELDAGLLD RTADCFFEMR 
DYENAVNVMR HVTATWPDDP SAWGKLGLML QTKGDLLGAE QAFEEVLKRD PNSIPALTAL 
NGIETFSVDS LYAQRLMSLS EREDLDAKHR ALIHYALAQI AHGSGEAEVA FTLFQSARNE 
VAGPFAPAIF DEMVAEQEAL FEPRPASEDA SLLPKLVFIG GMPMSGTGLV DRILAQHPGV 
FSVGAKTALS RTHGAIRMHL AKTDRPCNYW DWMEHLSAEE IDIFRQYYLE RALGGQVAGG 
KTIVDAHPLG CLEFGLAQFL FPEAKFVFMS RHPMDTALAN IASNVLNGNA LASRTEWIAQ 
VMRTVYSSAT VYASKLGDSM RLQSYEALVQ NSEREIGLLL EHAGLEYNAA CLTPNALCDV 
PQIATMLGQE ELSTETQNQW LPYEEQLQGF YEQLGGERWV SAWEDFDKTL R