Gene TM1040_2151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2151
Symbol
ID	4076750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2258932
End bp	2260680
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	58%
IMG OID	638007471
Product	hypothetical protein
Protein accession	YP_614145
Protein GI	99081991
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4961] Flp pilus assembly protein TadG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.940031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0926842
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTAA ACTTCTGGAC TTCATCGGCC CTGACCGGTG CGCTCGGTCG CCGGGCCATT 
GTGGACCGCA TGCGTCAGTT TCGCAGGGAC GAAAGTGGTG TCCTTGCCAA GCCGATGATT 
ATGATCGTGG TCTTGATGTT CATGATCGGC GGTCTGGGTA TGGATATGGT ACGCCTCGAA 
CGCGACCGTA CCAAACTGCA ATACACTCTG GACCGCGCGG TACTTGCGGC AGCGGATCTC 
GACCAGCCCC TCGATCCCGA GGCAGTGGTT CTCGATTACA TGTCAAAGTC GGGCCTTGGC 
GATTACACCA CGGTGGTCGT CCCTGAGGTT TCACCCACGG CAAAGCGCGT AAAGGCGAGC 
GTCGATACCA ATTTCACTGC ATCCTGGATG AACAACGTCT TTTACGACGA CTACATCCGC 
AATCCCGATA CTTACCAGCT TGAGCCAATC ACACTCCCGC TGCTGGCGTC CTCAACGGCG 
GTGGAGAGCA TCGGCAACGT CGAGATCTCG CTGGTGCTGG ACGTCTCGGG ATCGATGCGC 
AGCAATGATC GCCTGGTGAA CCTCAAACGC GCCGCCAAAG AGTTCGTCCA GACGATGGAT 
GACAACACCG AAGACGGCAA GATGAGCATT TCCATCGTGC CCTACTCGAC ACAGGTTTCC 
ATGCCGGAGG CCTTTCTTGA TGAGTTGAAC GTCAGCAGCG AGCACGATTA CTCCCACTGC 
ATCAACTTCT CGGGGTCCGA TTTCAACAAC GCCGGGATCA GCACGACCCA GGCCTACGAG 
CGCACCATGC ACTTCACCGT CTGGAACAGC GGCGACTATC GCTCAAGAAC CCGCCTCGTT 
CGTCAGCCGA CCTGTGCCGC CCATTCCGAC AACCCAGAGC GCACCGCGCT GTTGTTGTCG 
GACAATGTCA CGCAGCTGCA AAACTACATC GACGCCTTTG TCCCATCCGA GAACACATCG 
ATTGACCTCG GCATGAAATG GGGCTCTGCC CTTCTCGACC CATCCGTGCA GCCCGTGATT 
GCCTCGCTGG CTGATGATGC AAATCCCAAT CAGTCCATCG CATCGCGCTT TGCCAACCGT 
CCCGTCCCCT ACACGGATAC AGAGACGCTG AAGGTGATCG TGATGATGAC CGACGGTCAG 
AATACGTCGC AGTACTACCT CAGGAACAGC TACCGCGAGG GCGACAGCCC GGTTTGGTAC 
AACGCCCAAG AGCGTGTTTA TTCCACCTAT GACCCCAACC GCGGTTCAAA ACCCTATTAC 
TGGGACAACT TGCAGCGGTG GGCGGATCAC CCCTATGGCA ACGGCACCTA CGAGGAAACC 
TACTGCACCG GCACGCTCTA CTACGGCAAC TGCTATTACG GGTCCTGGCA GACCCGCACC 
GTGGACGAGC CCGGCACGGC CGTACAGCTG AGCTATCCTG ATCTCTTTGC CGACACCTCG 
CTCAGGTATC TGCGGGATCG CCTGTTCGGC GACTGGATGA GCAACGCGAA TTACTACTGG 
TTCTCCGGTC TGTTCAGCTC TGTCGGCTCC ACGACAAAGG ACGCGCGCAC GCTGGACATC 
TGTGAAGCGG CCAAAGCCAA GGGCGTTGTG GTCTTTACCA TCGGGTTTGA GGCTCCGAGT 
CGAGGCCAGG AAGTCCTGCA GGCCTGCGCA AGCTCTGCAT CCCATTACTA CGATGTTGAC 
GGGCTGGAGA TCTCCGATGC CTTCGCTTCA ATTGCCTCCG CGATCCGCCA ACTGAGGCTG 
ACAGAATGA

Protein sequence

MKVNFWTSSA LTGALGRRAI VDRMRQFRRD ESGVLAKPMI MIVVLMFMIG GLGMDMVRLE 
RDRTKLQYTL DRAVLAAADL DQPLDPEAVV LDYMSKSGLG DYTTVVVPEV SPTAKRVKAS 
VDTNFTASWM NNVFYDDYIR NPDTYQLEPI TLPLLASSTA VESIGNVEIS LVLDVSGSMR 
SNDRLVNLKR AAKEFVQTMD DNTEDGKMSI SIVPYSTQVS MPEAFLDELN VSSEHDYSHC 
INFSGSDFNN AGISTTQAYE RTMHFTVWNS GDYRSRTRLV RQPTCAAHSD NPERTALLLS 
DNVTQLQNYI DAFVPSENTS IDLGMKWGSA LLDPSVQPVI ASLADDANPN QSIASRFANR 
PVPYTDTETL KVIVMMTDGQ NTSQYYLRNS YREGDSPVWY NAQERVYSTY DPNRGSKPYY 
WDNLQRWADH PYGNGTYEET YCTGTLYYGN CYYGSWQTRT VDEPGTAVQL SYPDLFADTS 
LRYLRDRLFG DWMSNANYYW FSGLFSSVGS TTKDARTLDI CEAAKAKGVV VFTIGFEAPS 
RGQEVLQACA SSASHYYDVD GLEISDAFAS IASAIRQLRL TE