Gene Dshi_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1404
Symbol
ID	5712580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1457511
End bp	1458866
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	67%
IMG OID	641267316
Product	branched-chain amino acid ABC transporter
Protein accession	YP_001532747
Protein GI	159043953
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.977917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAATT CGGAAATCAG CCGCCGTCGC GTGCTGAAGA CAGGCGCTGC CACCGGCGCA 
GGCCTGGCAC TGCCCACCAT CTTCACCGGC GCCGCCTGGT CGGCGGGCTT CACCAACGAG 
CCCACCGGCA GCACCGTCAC CCTGGGCTTC AACGTGCCCC AGTCCGGCCC CTATGCCGAC 
GAGGGCGCCG ACGAGCTGCG CGCCTACGAG CTGGCGGTCG AGCACCTCAA CGGGGGCGGC 
GATGGCGGCA TGATGAGCAC CTTCAGCTCC AAGGCGCTGC AGGGCAACGG GATCCTCGGC 
AAGAAGGTCG AGTATGTCAC CGGCGACACC CAGACCAAGT CCGACGCCGC CCGCGCCTCG 
GCCCGCTCGA TGATCGAAAA GGACGGCGCG GTGATGATTA CCGGCGGGTC GTCCTCCGGC 
GTGGCCGTGG CCGTCCAGGC GCTCTGCCAG GAGGCGGGCA TCATCTTCAT GGCGGGCCTC 
ACCCATTCCA ACGACACCAC CGGCAAGGAC CGCAAGGCCA ACGGCTTCCG GCATTTCTTC 
AACTCCTACA TGTCCGGCGC GGCACTCGCC CCGATCCTGG CCAAGAACTA CGGCACCGAC 
CGCAAGGCCT ATCACCTGAC CGCCGATTAC AACTGGGGCT ACACCACCGA AGAAGCCGTG 
CGCTCCTCCA CCGAAGCCAT GGGCTGGGAG ACGGTGAACA CCGTTCTGAC GCCGCTCACC 
CAGACCGACT TCTCGGCCTA TATCACGCCC GTGCTGCAGT CGGACGCGGA TGTGCTGGTG 
CTCAACCACT ACGGCGGCAA CATGGTGAAC TCGCTGACCA ACGCGGTGCA GTTCGGCCTG 
CGCGACCGGG TGGTGAACGG CAAGAACTTC GAGATCGTCG TGCCGCTCTA CTCGCGCCTG 
ATGGCCAAGG GCGCCGGTGC CAACGTCAAG GGCATCTTCG GCTCCACCAA CTGGCACTGG 
TCGCTGCAGG ACGCAGGCTC CCAGGCCTTC GTGCGCTCCT TCGGCACCAA GTACGGCTTC 
CCGCCGTCCC AGGCCGCCCA TACCTGCTAC GTGCAGGCGC TGCTCTACGC GGACGCGGTG 
GAGCGCGCGG GCTCCTTCAA CCCCTGTGCC GTGGACGAGG CCCTGTCGGA TTTCGAATTC 
GACGGGATGG GCAACGGCCC GACCCTCTAC CGCGCCGCCG ACCACCAGTG CTTCAAGGAC 
GTGCTCGTGG TGCGCGGGAA GGAAAACCCG ACCTCCGAGT TCGACCTGCT GGAGATCGTC 
GAGGTGACCC CCGTCGAGCA GGTGACCTAT GCCCCGGACC ACCCCCAGTT CGGCGGCGCC 
GAGGCGACCC TCGGGACCTG CAACCCGGGC GCCTGA

Protein sequence

MSNSEISRRR VLKTGAATGA GLALPTIFTG AAWSAGFTNE PTGSTVTLGF NVPQSGPYAD 
EGADELRAYE LAVEHLNGGG DGGMMSTFSS KALQGNGILG KKVEYVTGDT QTKSDAARAS 
ARSMIEKDGA VMITGGSSSG VAVAVQALCQ EAGIIFMAGL THSNDTTGKD RKANGFRHFF 
NSYMSGAALA PILAKNYGTD RKAYHLTADY NWGYTTEEAV RSSTEAMGWE TVNTVLTPLT 
QTDFSAYITP VLQSDADVLV LNHYGGNMVN SLTNAVQFGL RDRVVNGKNF EIVVPLYSRL 
MAKGAGANVK GIFGSTNWHW SLQDAGSQAF VRSFGTKYGF PPSQAAHTCY VQALLYADAV 
ERAGSFNPCA VDEALSDFEF DGMGNGPTLY RAADHQCFKD VLVVRGKENP TSEFDLLEIV 
EVTPVEQVTY APDHPQFGGA EATLGTCNPG A