Gene Tcr_1303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_1303
Symbol
ID	3760685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	-
Start bp	1420142
End bp	1421656
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	47%
IMG OID	637786035
Product	extracellular solute-binding protein
Protein accession	YP_391572
Protein GI	78485647
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.173146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAACC GCAGAACGCT TTTTAAAGCC AGCCTCGTTT CGGCAACGGG GCTGTTGTTA 
CAAAGTTGTG CTTCTTCTCA AGGGCAAGAG CGACAAATCA AAGTGGGGGT GACTTCTCGC 
CCCCGAATGC TGGACCCGCG TCAGGCAACG GATGCGTTAT CCAGCCGAGT GAATCGATTG 
ATTTACCGTC AGTTAATCGA CTTTAATGAA TCGTTCGAGC CGATTCCCGA CTTGGCGACC 
TGGCAACAGA TTTCGCCAAC ACACTATCGT TTTACGCTAA CCGAATTTCC ACGGTTTCAT 
CATGGCATGC CTTTAACCGC AGAAGATGTG GCGGCGACTT ATCGAAGCAT TCTGGATAAA 
ACCTTAGGTT CCCCTCATCG CGGTTCTTTA AAGAAAATTA CTCAAATTGA CGTGTTGAAT 
AATGCCGAAT TGGACTTTCA CTTGGAAGCG CCGGATGCGT TGTTTGTTGG GCGCTTGGTG 
ATCGGAATTT TGCCGAAAGA TTTGATTGAA AGTCAGCATG CCTTTCAAAA AACACCGATT 
GGATCGGGGC CGTGTTTATT TAAGTCAATG ACCGAGCAAA AGCTGGTTCT GGAACGACCG 
GATGCTGTGC AACTGGTTTT TATTCCAGTT AAAGACGCGA CCGTGCGCGT GCTGAAATTG 
CGAAAAGGCG AATTGGATAT CATTCAAAAT GATTTATCTC CTGAGCTGGT TTCGTATTGT 
GACAAACTGG ATGAATTAAA CGTGCAATGG CATGATGGCA CTAATTTTGG GTATGTCGGA 
TTTAACTTTG ACGATTCGTT ATTGTCACAG TTAGAAATGC GGCAGGCATT GGCTTACGGT 
ATTAACCGTC AGGCGATTGT TGATGCGGTA TTCGATGGTC ATGCGCGTTT GGCAGGCGGC 
TTATTGGTGC CGGAACACTG GAGTGGGGTG GCGGACATTC ATGGGTTTGA TTATCGACCT 
AATAAAGCCA AACAGCTGGT GGATTCCCTT AAACAAAAAC AACCAGGCCT GGTCAATGAC 
GATGGAATGA TAGAGTTGAG TTATAAGACC TCTTCGGACC CGACGCGTAT TCGATTGGCA 
ACCATTTACC AATCTCAACT GAGAAAAATC GGGGTGGCCT TAAAAGTACA GAGTTATGAT 
TGGGGAACGT TTTACAACGA CATCAAACAA GGCCGTTTTC AACTCTATAG CCTGGCTTGG 
GTTGGGGTGA AAAGCCCGGA TATTTTTCAG TATGTGTTTG ACAGTGATGC GATTCCGCCC 
AAAGGAGCGA ATCGAGGGCG ATATCGAGAC CCGCAAGCCG ATGCATTGAT TCGTGAGGCG 
GGTCATACTC AGTCATTAGC CAAACAGGCC GAGTTGTATC AAGATTTACA GAGACGGTTA 
CAAGAAACTT TAGCCGTTAT TCCGTTGTGG TATGAAGATC AGTATGCCGT GACACGCCCA 
CAGGTTAAAG GATACCAACT CTATTCAGAT GGACGGTTCG ATGGGTTGTT GTCTGTTGAG 
TTGGGCGAGA CATAA

Protein sequence

MLNRRTLFKA SLVSATGLLL QSCASSQGQE RQIKVGVTSR PRMLDPRQAT DALSSRVNRL 
IYRQLIDFNE SFEPIPDLAT WQQISPTHYR FTLTEFPRFH HGMPLTAEDV AATYRSILDK 
TLGSPHRGSL KKITQIDVLN NAELDFHLEA PDALFVGRLV IGILPKDLIE SQHAFQKTPI 
GSGPCLFKSM TEQKLVLERP DAVQLVFIPV KDATVRVLKL RKGELDIIQN DLSPELVSYC 
DKLDELNVQW HDGTNFGYVG FNFDDSLLSQ LEMRQALAYG INRQAIVDAV FDGHARLAGG 
LLVPEHWSGV ADIHGFDYRP NKAKQLVDSL KQKQPGLVND DGMIELSYKT SSDPTRIRLA 
TIYQSQLRKI GVALKVQSYD WGTFYNDIKQ GRFQLYSLAW VGVKSPDIFQ YVFDSDAIPP 
KGANRGRYRD PQADALIREA GHTQSLAKQA ELYQDLQRRL QETLAVIPLW YEDQYAVTRP 
QVKGYQLYSD GRFDGLLSVE LGET