Gene Saro_0612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0612
Symbol
ID	3915624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	658339
End bp	659421
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	64%
IMG OID	640443342
Product	ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_495893
Protein GI	87198636
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR03427] ABC transporter periplasmic binding protein, urea carboxylase region

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0367247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCACGC TGATTGGCAA GCTCGGTATG ACGGGTCTGT TCGCGGGGGC GTTGCTGATC 
GCATCCTGCT CACCCTCTGG TGCGCCCCAT GCCGAACCCC GCAAGGAGTT CAGCATAGGC 
TGGTCGATCT ATGCGGGATG GATGCCCTGG CCCTATGCCC AGCAGGCCGG CATCGTGAAG 
AAGTGGGGCG ACAAGTACGG CATCAGGATC AACGTCGTAC AGGTCAACGA CTACGTCGAA 
TCCGTAAACC AGTACACCGC AGGCAAGTTC GACGGCGTGA CCGTCACCAA CATGGACGCG 
CTGACCATTC CCGCCGCGGG CGGCAAGGAC ACGAGCGCGA TCATCGTCGG CGACTATTCC 
AACGGCAATG ACGGCATCCT GCTGAAGGGC GGCAATTCGC TTGCCGACAT CAAGGGGCGC 
GAAACATATC TGGTCGAGCT TTCGGTGTCC CACTACCTGC TCGCCCGCGG GCTGGAAAAG 
GCGGGTCTGA AGCCGACCGA CGTCAGGACC GTGAACACCT CCGACGCCGA TCTCGTCAGT 
GCGTTCAGCG CGCCTGACGT GACCGCCGCG GTCACCTGGA ACCCGCAGCT CTCGGTGATG 
AAGGCTCAGC CCGGCGTCAC CCAGGTCTTC AGTTCCGCCG ACATTCCGGG CGAGATCGTC 
GACCTTCTGG TGGTCGATAC CGCCACGCTC AAGGCCAATC CCGATCTCGG CAAGGCGCTG 
GCAGGCATCT GGTACGAAAC CGTCGCCCTG ATGCAGCGGC AGGACGAACA GGGCAAGGCT 
GCGCGGGCCG CCATGGCCAA GCTCTCGGGC TCGACCCCGC AGGCGTTCGA CAGCCAGCTC 
AAGACAACGT TCCTCTATGG CGAACCCAAG GCCGCCGTCG ACGCCGCCAC CGCGCCCGCG 
CTCGTGACGA CGATGACCAA GGTCCGCGAT TTCAGCTTCT CGAAGGGCTT GTTCAAGGGC 
GCCGCCTCGG CCGATGCGGT CGGCATGGCC TTCCCCGGCG GCAAGACCCT TGGCGATCCG 
CAGCACGTCA CCCTGCGCTT CGACGAAAGC TTCATGAAGC TGGCCGCCGA CGGCAAGCTC 
TGA

Protein sequence

MVTLIGKLGM TGLFAGALLI ASCSPSGAPH AEPRKEFSIG WSIYAGWMPW PYAQQAGIVK 
KWGDKYGIRI NVVQVNDYVE SVNQYTAGKF DGVTVTNMDA LTIPAAGGKD TSAIIVGDYS 
NGNDGILLKG GNSLADIKGR ETYLVELSVS HYLLARGLEK AGLKPTDVRT VNTSDADLVS 
AFSAPDVTAA VTWNPQLSVM KAQPGVTQVF SSADIPGEIV DLLVVDTATL KANPDLGKAL 
AGIWYETVAL MQRQDEQGKA ARAAMAKLSG STPQAFDSQL KTTFLYGEPK AAVDAATAPA 
LVTTMTKVRD FSFSKGLFKG AASADAVGMA FPGGKTLGDP QHVTLRFDES FMKLAADGKL