Gene Oant_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_3804
Symbol
ID	5381713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009668
Strand	-
Start bp	1197839
End bp	1199368
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	57%
IMG OID	640836490
Product	extracellular solute-binding protein
Protein accession	YP_001372339
Protein GI	153011125
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00625229
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAGGA AAACACTTAA AGCCGTTCTC ATGGCTTCCG CTCTCTCGGC GGCAGTGTTT 
GTATCTGCTC CGGCTTTCGC TGCCGGAAAG CTGACCGTTT CGTCGCCGCA GGACCCAGGC 
AGCTGGGACC CGATCGACAC TTTCCTCGTC AACTGGGCTT CTGTCGCCAC CAATATTTTC 
GACGGTCTGG TCTATCGCGG ACCGGACCTC AAGATCGTTC CGGCCCTCGC AACCTCGTGG 
GACGAGCTAG ACGAAGGCAA GCGCATCCGC TTCCATCTGC GCGAGAACGT CAAGTTCCAT 
AATGGCGAGC CGTTCAACGC CGAAGCCGTC AAGTTCACCT TTGATCGCCT GCTCGGTGAC 
GAGGGCGCGA AAGGCCCGCA GCGTTCGAAC TATATCGCCA TCGAGAAAGT GGAAGTTATA 
GACGACAAGA CCGTCGATTT TCATTTGAAG GCACCGGACC CTGTTCTCAT CACCAAGCTG 
GCCGGTTATG GTGGCATGAT CGTTCCGCCA AAATACATTC AGGAAAAAGG CGACGATTAT 
TTCAACACGC ATCCGGTCGG TACCGGGCCA TTCAAATTCG CGTCCTATGA ACCGAAGGTG 
AGCATCAAGC TTGAGGCTTT CGCTGATCAT TGGGGCGGTG CGCCGAAACT TTCCGAACTG 
GAATATCGCT TCATCACCGA GCCTTCGACC GCCGTTGCCG AACTTCAGGC CGGTCGCGTC 
GATCTGGTCA TCCCGCCGAC CATTCCGATT GGTATGATCC CGACCATTCA GGGCGATCCG 
AAGCTGGAGC TTGTCACTGC ATCGGGTCCA ACTGTCTATG CCCTGCGCTT CAACACGGCT 
GATGGCATCA CCAAGGACGA GCGCGTTCGC AAGGCGCTGA TCATGGCGGT TGACCGCGAT 
GCGATCATCC AGTCCATTCT GGCAGGTCAG GCCGAGCCGA TTGCAAGTTT CCAGGGTTCG 
CTGTCCTTCG GCTTCGACCC GAACATGAAG CCGCTGCCTT ACGATCCGGA AGGCGCGAAG 
AAACTGCTCG AAGAAGCGGG CGTCAAGCCT GGCGCAACCG TGCAGATCGA TGTGCGCGGT 
CAAGATGCAA GCTTCAATGA AGTGGCGCAG GCTATCGCAA GCTTCCTGCA AATGGTCGGC 
GTCAATGCCA CCATCAAGCC TTATGACACC AATGTTTTGC TGAACGATAT CATCCCGCAG 
GGCAAGACCG GCGCCATGTT CCAGCAGGCC TGGGGCGGCT GGACCTTCGA CTACGATAAC 
ACCGCCTATT CCATGTACCA TTCCGGCGAG AAGTGGAACC CGTACGACAA GGACGAAAAG 
CTCGACAAGA TGCTGGAAGC GCAGCGCTCG GTTATTGATC GCGGCGAGCG CGAAAAGCTC 
TTGCAGGAAA TCGCGGTTTA CGCTGCCGAC CGTGCACTCG AAATGCCGCT TTACAATCTC 
AAGGCAATCT TCGGCGTCAA CAAGCGCGTG AAGAACTTCG TGCCGGTGCC TGACAGCCGT 
CTGCGTTTGA CGGACGTCAC TGTCGAGTAA

Protein sequence

MIRKTLKAVL MASALSAAVF VSAPAFAAGK LTVSSPQDPG SWDPIDTFLV NWASVATNIF 
DGLVYRGPDL KIVPALATSW DELDEGKRIR FHLRENVKFH NGEPFNAEAV KFTFDRLLGD 
EGAKGPQRSN YIAIEKVEVI DDKTVDFHLK APDPVLITKL AGYGGMIVPP KYIQEKGDDY 
FNTHPVGTGP FKFASYEPKV SIKLEAFADH WGGAPKLSEL EYRFITEPST AVAELQAGRV 
DLVIPPTIPI GMIPTIQGDP KLELVTASGP TVYALRFNTA DGITKDERVR KALIMAVDRD 
AIIQSILAGQ AEPIASFQGS LSFGFDPNMK PLPYDPEGAK KLLEEAGVKP GATVQIDVRG 
QDASFNEVAQ AIASFLQMVG VNATIKPYDT NVLLNDIIPQ GKTGAMFQQA WGGWTFDYDN 
TAYSMYHSGE KWNPYDKDEK LDKMLEAQRS VIDRGEREKL LQEIAVYAAD RALEMPLYNL 
KAIFGVNKRV KNFVPVPDSR LRLTDVTVE