Gene TM1040_1795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1795
Symbol
ID	4076824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1888716
End bp	1889606
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	59%
IMG OID	638007110
Product	Sec-independent protein translocase TatC
Protein accession	YP_613790
Protein GI	99081636
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0805] Sec-independent protein secretion pathway component TatC
TIGRFAM ID	[TIGR00945] Twin arginine targeting (Tat) protein translocase TatC

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0386851
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.066575
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAA CAGACGATCT TGACGATTCC ACAGCGCCGC TGATCGAGCA TCTGGCCGAA 
TTGCGCAGCC GCCTGATCCG GGCGGTCATG GCCTTTGCGG TGGGGATCGT GCTGGCCTTT 
ATGGTAGCCG AACCGATCCT GCAGTTCCTC GTCGCTCCGA TCGAGCAGAC CCTACGAGAA 
TTGGGCGATC CCTCCCCGAC GCTGCAGTAT ACCTCGCCGC AGGAGTATCT CTTTACCCTT 
TTCCGGATCT CGATGGTGTT TGGATTTGCG CTGTCGTTCC CGGTGATCGG CTTTCAGCTC 
TGGCGGTTTG TGGCGCCGGG CCTCTACAAG AGCGAGAAAG GCGCGTTTCT GCCGTTCCTG 
ATTGCCTCGC CCTTCATGTT CCTGCTTGGC GCGTCCTTTG CGCAATTTGT GGTGACGCCA 
CTGGCAATGC AGTTCTTCCT CGGCTTTGCT GACGTGAGCT CGATCTTTGC GGGCCTGTTG 
TCGCAAGCCA CCGGAGGCGA CGTGCCTGCG GATGTTGCCG TGGTGCCGGA GACATCCGAA 
GGGGTGAAGA TCACCTTCTT TGGCAAAGTG AACGAGAGCC TTGATATTAC GCTCAAATTC 
ATCATGGCCT TTGGTCTGTG CTTCCAGCTG CCGGTTCTTC TCACCCTGAT GGGCAAGGCC 
GGATTGGTGA GCGCCGAAGG GCTGGGTGGC ATGCGCAAAT ATGCGGTTGT GGCCATTCTG 
GTGCTGGCCG CGTTGGTGAC GCCGCCGGAT GTGATCACCC AGATCATTCT CTTTACGGTG 
GTCTACGGGC TTTATGAGGT ATCGATCTTC CTCGTCGGGC GCGTCGAGAA AAAGCGCGAG 
GCGCAGCTGC GCGCCGAAGG CTACTATGAC GACGAGCTGG ACGGCGAATA A

Protein sequence

MSQTDDLDDS TAPLIEHLAE LRSRLIRAVM AFAVGIVLAF MVAEPILQFL VAPIEQTLRE 
LGDPSPTLQY TSPQEYLFTL FRISMVFGFA LSFPVIGFQL WRFVAPGLYK SEKGAFLPFL 
IASPFMFLLG ASFAQFVVTP LAMQFFLGFA DVSSIFAGLL SQATGGDVPA DVAVVPETSE 
GVKITFFGKV NESLDITLKF IMAFGLCFQL PVLLTLMGKA GLVSAEGLGG MRKYAVVAIL 
VLAALVTPPD VITQIILFTV VYGLYEVSIF LVGRVEKKRE AQLRAEGYYD DELDGE