Gene TM1040_2550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2550
Symbol
ID	4076681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2692619
End bp	2693725
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	58%
IMG OID	638007874
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_614544
Protein GI	99082390
COG category	[R] General function prediction only
COG ID	[COG4239] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.247928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.144081
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTGT CTCCTCTCAA TCAGCGGCGG TGGAACAACT TCAAACGCAA CCGTCGCGCC 
CTGTGGTCGC TCAGGATCTT TTTGGTGCTG TTTGGCCTGT CGCTGTTTGC GGATGTTCTC 
GCGAACGACA AACCGATCCT CGTGAATTAT CGCGGCGACT ATTACACGCC TGTTTGGAAC 
TTCTATCCCG AGACCACCTT TGGCGGTGAT TTCCAGACCG AAGCCGTCTA CCGCGATCCC 
GAAGTGAAAT GTTTGATTGC CTCTGGAGGC AGTCTCGATT GTTTTGACGA TCCCGAAGGG 
ATCATGGCTG CGATTGATTC AGGCACATAT GCAGCCGAGG ATTTTGTCGA AGGCTGGTCG 
CTCTGGCCGC CGATCCCTTA CCGGTTTGAC ACGCCGGTTG ATCGCGCGGG CGCAGCCCCG 
CTGCCGCCAA ACGGGCAGAA CTGGCTCGGG ACCGATGACA CCAAACGCGA TGTGCTTGCC 
CGCGTTATCT ATGGTTTCAG ACTCTCCATC CTTTTCACCC TGATCGTCAC CCTTGCGGCG 
AGCCTGATCG GGATTGTTGC GGGCGCGGTG CAGGGGTTCT TTGGCGGATG GGTTGATCTG 
ATCTTCCAAC GTGTCATCGA GATCTGGTCA GCGACACCGT CGCTCTATGT CATCATCATC 
ATGTTTGCGA TCCTCGGGCG AAGTTTCTGG CTCCTTGTCT TCCTGATGAT CCTGTTCAGT 
TGGACCGCTC TTGTGGGGGT GGTGCGCGCG GAGTTCCTGC GCGCCCGCAA CCTCGAGTAT 
GTCCGCGCGG CCAAGGCGCT GGGGGTCGGC AATGTAACGA TCATGTTCCG CCACATGCTG 
CCCAATGCGA TGGTGGCGAC GCTCACCATG CTGCCGTTCA TCGTGACAGG GACCATCGGC 
ACATTGGCAA GCCTCGACTT CCTTGGTTTT GGGCTGCCGT CGTCGGCGCC CTCCTTGGGG 
GAGATGACCT TGCAGGCCAA ACAGAACCTG CAAGCGCCCT GGCTTGCCTT TACCGCCTTC 
TTCACCTTTG CAATCATGCT CTCGCTTCTG GTCTTCATTT TTGAAGGCGT GCGGGACGCG 
TTTGACCCGA GAAAGACCTT TTCATGA

Protein sequence

MALSPLNQRR WNNFKRNRRA LWSLRIFLVL FGLSLFADVL ANDKPILVNY RGDYYTPVWN 
FYPETTFGGD FQTEAVYRDP EVKCLIASGG SLDCFDDPEG IMAAIDSGTY AAEDFVEGWS 
LWPPIPYRFD TPVDRAGAAP LPPNGQNWLG TDDTKRDVLA RVIYGFRLSI LFTLIVTLAA 
SLIGIVAGAV QGFFGGWVDL IFQRVIEIWS ATPSLYVIII MFAILGRSFW LLVFLMILFS 
WTALVGVVRA EFLRARNLEY VRAAKALGVG NVTIMFRHML PNAMVATLTM LPFIVTGTIG 
TLASLDFLGF GLPSSAPSLG EMTLQAKQNL QAPWLAFTAF FTFAIMLSLL VFIFEGVRDA 
FDPRKTFS