Gene TM1040_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1821
Symbol
ID	4076967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1915660
End bp	1916616
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	58%
IMG OID	638007136
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_613816
Protein GI	99081662
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.054126
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.742084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCGG TGATCAAACT ATTGGCTCAG CGCATTGCGC TGAGTCTCTT CCTGCTGTTG 
ATGATCTCGG CGCTGATCTT TGCGGGCACC ATGATCCTGC CCGGCGACGT CGCCCAGTCC 
ATCCTCGGCC AATCCGCAAC CCCCGAGGCG CTCGCCAACC TGCGCGCCGA GCTTGGACTG 
AACGAACCCG CCCTCACGCG CTATTTCGAC TGGCTTTTTG GTGCCTTGCA AGGCGATCTT 
GGCACCGCTC TGACCTCTGG TCAGGACATC ACTTCCGCCA TTGGATCGCG CCTCTCGAAC 
ACGCTGTTCC TTGCGTTCTG GGCCGCTGTG ATCGCCGTGC CGCTGGCGAT TTTCCTCGGT 
CTTCTGGCCG TGCGCTACAA AGATCGCTGG CCGGACAAGC TGATTTCCGG CGTCACATTG 
GCGTCGATCT CCATTCCTGA ATTCCTGATC GGTTACGTTC TGATGTATCT GATCGCCGTA 
AAACTGCGCT GGTTTCCCTC TGTCGCCATG ATCAACGACG GCATGAACCT GTGGCAGAAG 
CTCAATTCCA TCGCCCTGCC CGTCGCGGTG CTGACGCTTG TGGTGCTTGC CCACATGATG 
CGCATGACCC GTGCGGCGAT CCTCAACGTG ATGCAGTCCG CCTATATCGA GACTGCGGAA 
CTCAAGGGGC TTTCGACCTT CAAGGTGATC TGGCGTCATG CCTTCCCCAA CTCGATCGCG 
CCGATCGTGA ATGTGGTGAT GCTGAACCTC GCCTATCTTG TGGTTGGTGT CGTGGTGATC 
GAAGTGGTCT TCGTCTATCC CGGCATGGGG CAATATCTGG TGGATCATGT CTCCAAACGT 
GACGTGCCGG TGGTGCAGGC CTGTGGTCTG ATCTTTGCCA CCGTCTATAT CGGCCTCAAC 
ATGGTTGCCG ATATCGTGTC GATCCTGTCG AACCCGCGTC TGAGGCATCC GAAATGA

Protein sequence

MNPVIKLLAQ RIALSLFLLL MISALIFAGT MILPGDVAQS ILGQSATPEA LANLRAELGL 
NEPALTRYFD WLFGALQGDL GTALTSGQDI TSAIGSRLSN TLFLAFWAAV IAVPLAIFLG 
LLAVRYKDRW PDKLISGVTL ASISIPEFLI GYVLMYLIAV KLRWFPSVAM INDGMNLWQK 
LNSIALPVAV LTLVVLAHMM RMTRAAILNV MQSAYIETAE LKGLSTFKVI WRHAFPNSIA 
PIVNVVMLNL AYLVVGVVVI EVVFVYPGMG QYLVDHVSKR DVPVVQACGL IFATVYIGLN 
MVADIVSILS NPRLRHPK