Gene TM1040_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0447
Symbol
ID	4076090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	465297
End bp	466481
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	62%
IMG OID	638005743
Product	extracellular ligand-binding receptor
Protein accession	YP_612442
Protein GI	99080288
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.766827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTTA TGTTTGCTGT TTTCAATCGG GCCCGCAAGA TTGCTTTGAC CGCCACCGCA 
GTTGTTGCCT CTGCATTTGT CGCCGCCTGT GACCCCGGAG CATTGTCCGG CGGGGGGCCG 
ACCATCAACA CCTCCAAACC TGTGCCTGTC GCACTGCTGG TACCGCGCGG TTCGGCACAG 
CATGGTGATG GCGTTCTGGC CCAGAGCCTT GAAAATGCAG CCCGCCTCGC GATTGCGGAT 
CTGAACGGCG TAGAGGTGGA CCTGCGTGTC TATGACACAG CGGGCAACCC TGAAACCGCC 
GCTGCCGTTG CCTCGCAAGC GGTGCAGGAC GGCGCGCGCA TCATTCTTGG TCCGGTCTAT 
GCCGAAGCCG CAAATGCCGC AGGGATTGCC GCCGCAAAGC GCGGTGTGAA CGTGCTGGCC 
TTCTCCAACA ATGCCTCGAT CGCGGGCGGC AACGTGTTCG TTCTGGGCTC GACCTTTGAG 
AACTCCGCCA ACCGCTTGAC CCAATATGCC AAACGCCAGG GCAAGAACTC CATGGTGGTT 
GTGTCGGGCA ATAATGCCGC CGGACAGGCC GGGCGTTCTG CCATTCAGCA GGCCGCCGTG 
CAGAGTGGCA TGACCATTAC GGGCAACGTC AGCTATGAGC TGTCGCAGCA GGGTGTGATC 
AACGCGATCC CGACCATTAG CCAGAATGTG CGTCAGAACA AAGCGGACGT GATGTTCATG 
ACCGCGACCA CCGCAGGCGC GCTGCCGCTG TTGTCGCAGC TGTTGCCCGA AGCCGGTGTC 
ACGCCAGAAG ACGTGCAGTA CATGGGCCTG ACCCGTTGGG ACATCCCCGC GCAGACGCTT 
GAACTGCCCG GAGTTCAGAA CGGCTGGTTC GCCCTGCCCG ACCCACAGAA GTCTGCCTCT 
TTCCGTGCAC GTTATCAATC CGCATATGGC GCGGCACCGC ACCCGATCGG TGGTCTGGCC 
TATGACGGGA TCGCCGCCAT TGGCGCGCTG GTCAGCTCTG GCAACTCCGG GGCGCTCACC 
GGTGCGGCTC TGACACAACC CGCAGGTTTC CAGGGCACAG GGGGTATTTT CCGCCTGCGC 
CCGGATGGCA CCAGTGAACG TGGTCTCGCC ATCGCAACGA TCCAGGACAA GAAAGTCGTC 
ATCATTGACC CAGCGCCACG AAGCTTCCCC GGAGCCGGTT CCTGA

Protein sequence

MRFMFAVFNR ARKIALTATA VVASAFVAAC DPGALSGGGP TINTSKPVPV ALLVPRGSAQ 
HGDGVLAQSL ENAARLAIAD LNGVEVDLRV YDTAGNPETA AAVASQAVQD GARIILGPVY 
AEAANAAGIA AAKRGVNVLA FSNNASIAGG NVFVLGSTFE NSANRLTQYA KRQGKNSMVV 
VSGNNAAGQA GRSAIQQAAV QSGMTITGNV SYELSQQGVI NAIPTISQNV RQNKADVMFM 
TATTAGALPL LSQLLPEAGV TPEDVQYMGL TRWDIPAQTL ELPGVQNGWF ALPDPQKSAS 
FRARYQSAYG AAPHPIGGLA YDGIAAIGAL VSSGNSGALT GAALTQPAGF QGTGGIFRLR 
PDGTSERGLA IATIQDKKVV IIDPAPRSFP GAGS