Gene TM1040_1598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1598
Symbol
ID	4078407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1709078
End bp	1710358
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	61%
IMG OID	638006911
Product	twin-arginine translocation pathway signal
Protein accession	YP_613593
Protein GI	99081439
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.121654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.207213
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAACA TGCTGGCCTC CGTTTGGGCG CTCCTGGCCG GAGTCGTGCT CATCATGCTG 
GGCAACGGGA TGCATTTTAC CTTGATGGGG CTGCGTGGCG GGGTCGAGGG GTTCTCCTCG 
GCCGAGCTCT CCATCGTGAC CTCTGGCTAT TTCCTCGGCT TTTTATCAGG CGCGCGCTTT 
ACACCGCTCC TGATCCAGCG CGTGGGTCAT GTGCGGGTGT TTGCAGCGCT CGGCAGCTTT 
ATCTCGGCGG CGCTCATTGC CTTTACGCTA TGGGTCGAGC CCTGGACATG GACGCTCCTG 
CGGATCTTGA TCGGTTTTTG CATGTCTGGG ATTTATGTGG TTGCCGAAAG CTGGCTCAAC 
AATTCCACCA GCAATGAGAA CCGGGGCAAG ATGCTCTCGG CCTACATGCT GGCGCAGACA 
CTAGGCATCA TCGGCGCGCA GGGTTTGCTG ACGCTTGGGG ATGCTGCCAA TGCTGCGCTG 
TTTATTGGCG CGTCGATCCT GGTGTCCATT TCCTTTGCGC CGATTTTGCT GTCGATCCAG 
CCCGCCCCCC TCGTCGAAGT GACCAAACCC GGTGGTTTGA AGGATCTTTT TGCAGCCTCG 
CCGCTTGGGA CCGCAGGTAT TTTTGTGCTG GGCAGTATCT ATGCCAGCCA GTCCGGCATG 
GGCGCGGTGT TTGGCAGCGA GATCGGCCTG AGCGCCAATC AGATCGCGCT GTTCGTCGCG 
ATGCTGTTTG GTGGTGCCTT GTTCATGCAG GTGCCGATTG GCTGGCTGTC GGACCGGCTG 
GATCGGCGCA AGGTCATCTG TGGCACCGCG GCGCTTGGGG CCGCCGCCTG TGGACTTGGC 
TGGTTGGCGC AGAGCCCGCC TGCCTGGCTC GGGGTTGACC CGCTTGTTCC CATTATGGCG 
GCGGCCTTTC TCGCAGGGGG CATGACAACG CCGCTCTATG CGCTCTTGCT GGCCTATACC 
AATGACAATG TCGCCGCCGA GGATATGCCC GCGATCTCGG GCGGGCTGGT CTTTACGTTT 
GGGCTTGGTG CGATCATCGG GCCGATTGCG GTTGGTCTGG CGATGAACGC CACAGGTCCC 
TTTGCATTCT GGATGGTGCT TGGCGCTGCC TTCCTGATGA TCACGCTCTA TGCGCTCTAC 
CGGATGTCGC AGAGTGAGGC GACGCCGGTC TCTGAGACCG ACGCCTATGT CAACCTCGTG 
CCTTCAGCGA CCATTGTGGC GGTTGAGGAT GCAACCACCT GGGCGGCAGA GAATGCAGAC 
GTGGACCCGT CTGAGCCCTA G

Protein sequence

MINMLASVWA LLAGVVLIML GNGMHFTLMG LRGGVEGFSS AELSIVTSGY FLGFLSGARF 
TPLLIQRVGH VRVFAALGSF ISAALIAFTL WVEPWTWTLL RILIGFCMSG IYVVAESWLN 
NSTSNENRGK MLSAYMLAQT LGIIGAQGLL TLGDAANAAL FIGASILVSI SFAPILLSIQ 
PAPLVEVTKP GGLKDLFAAS PLGTAGIFVL GSIYASQSGM GAVFGSEIGL SANQIALFVA 
MLFGGALFMQ VPIGWLSDRL DRRKVICGTA ALGAAACGLG WLAQSPPAWL GVDPLVPIMA 
AAFLAGGMTT PLYALLLAYT NDNVAAEDMP AISGGLVFTF GLGAIIGPIA VGLAMNATGP 
FAFWMVLGAA FLMITLYALY RMSQSEATPV SETDAYVNLV PSATIVAVED ATTWAAENAD 
VDPSEP