Gene Saro_2068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2068
Symbol
ID	3917715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2207602
End bp	2209398
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	67%
IMG OID	640444820
Product	ABC transporter related
Protein accession	YP_497341
Protein GI	87200084
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAG CACCGATCCT CAGCTGGGAA GGCCTTGGAC TTCTCCAGGG CAATGGCTGG 
CTTTTTCGCG ACCTCGACAT CCACATCGGC CCGCGCGACC GCCTGGCGCT GATCGGGCGG 
AACGGCGCGG GCAAGACCAC GCTGCTCAAG CTGCTGGGCG GACAGATCGA TGCGGACAAG 
GGTACCCGCT CGATCCAGCC CGGCACCAGG ATCGTGACGC TGGAGCAGGA CCCCTTCTTC 
ACCGGCTATG ACACGCTGAT GGACTTCGCG CTGTCGGGCA AGGACGCGCC GGCCCGACAC 
GAGGTCGAAT CGATTGCCGG GCAGCTCGGC ATCGACATGA GCCGCAAGGC GGACAGCGCC 
AGCGGTGGCG AGCGGCGTCG GGCGGCCCTC GCCCGCGCAC TGGCAAGCGA GCCGGACCTG 
CTCCTGCTCG ACGAGCCGAC CAACCACCTC GACCTTGCCG CCATCGACTG GCTGGAGGAC 
TGGCTCCAGC GGTTCAAGGG TGCGTTCGTG GTGATCAGCC ACGACCGCAC CTTCCTCGAA 
CGCCTGACCA GGGCGACGCT CTGGCTCGAC CGTGGATCGT TGCGCCGCAA GGACATTGGC 
TTTGGCGGGT ACGAGGCCTG GATGGAACAG GTCTATGCCG AGGAAGCCCG CGCCGCCGAC 
AAGCTCGACG CCAAGCTGAA GATCGAAGCC CACTGGCTGG AACGCGGCGT CACCGCGCGG 
CGCAAGCGCA ACATGGGCCG CCTCGAAAAG CTTTATGAAA TGCGCGCGCA GCGGGCGGCG 
ATGCTCTCGC CGCAGGGCAC CGCAAAGCTC GCCATCGCCA GCGACGATGC CAAGAGCAAG 
GCGGTGATCG TCGCCGACCA CGTCAACAAG TCCTTCGGCG ATCGCCCGAT CGTCAAGGAC 
TTCACCCTGC GCATCACGCG CAAGGACCGC ATCGGCGTCG TCGGATCGAA TGGCGCGGGC 
AAGACCACGC TGCTCAAGCT CCTGACCGGC GAACTCGCGC CCGACAGCGG CACCGTGACG 
CTGGCCAAGA CCCTCCAGGG CGTGATGATC GACCAGCAGC GCAGCCTGAT GGCGCCGGAA 
AAGCGCGTGC GCGACGTGCT GGCCGATGGC AGCGACTGGA TCGACGTGCG CGGGGTCCGC 
AAGCACATCC AGGGCTATCT CAAGGACTTC CTGTTCGATC CCGGCCTTGT CGAGGCGCGC 
GTCGGCACGC TTTCGGGCGG CGAGCGGTCG CGCCTCCTGC TGGCACGCGA ATTCGCGCGC 
AAGTCCAACC TGCTGGTGCT GGACGAGCCG ACCAACGACC TCGACCTGGA AACGCTGGAT 
CTGCTCCAGG AAGTGATAGC GGACTATGAC GGCACGGTGC TGATCGTCAG CCACGACCGC 
GACTTCCTCG ACCGCACGGT CACGATCACG CTGGGCATGG ACGGTTCGGG CCGGGTCGAT 
ATCGTCGCTG GCGGCTATGC CGACTGGGAA AAGATGCGCA AGAGCAGAGG CGCGGGCGCT 
GCAAAGGCGG CATCGCCCCG GGAAGCCGGA GCCCCTCCAC CGCCTCCACC GCCGCCGCCG 
GCGAAGAAGG GCAAGCTTTC CTACAAGGAC CAGCGCGACT ACGAACTTCT GCCGACGCGC 
ATCGAGGAAC TCGAGGCAGC AATCGCGCGT GGCGAAGCCC AGTTGGCCGA CCCGGACCTC 
TACGCCAGGG ACCCGAAGAA GTTCGACGCG CTGATGGCGG CGCTGGAAAA GGTGCGGGGC 
GAGAAGGAAG CAGCCGAGGA GCGCTGGCTG GAACTGGCCG AAATGGTCGA GGGCTGA

Protein sequence

MAAAPILSWE GLGLLQGNGW LFRDLDIHIG PRDRLALIGR NGAGKTTLLK LLGGQIDADK 
GTRSIQPGTR IVTLEQDPFF TGYDTLMDFA LSGKDAPARH EVESIAGQLG IDMSRKADSA 
SGGERRRAAL ARALASEPDL LLLDEPTNHL DLAAIDWLED WLQRFKGAFV VISHDRTFLE 
RLTRATLWLD RGSLRRKDIG FGGYEAWMEQ VYAEEARAAD KLDAKLKIEA HWLERGVTAR 
RKRNMGRLEK LYEMRAQRAA MLSPQGTAKL AIASDDAKSK AVIVADHVNK SFGDRPIVKD 
FTLRITRKDR IGVVGSNGAG KTTLLKLLTG ELAPDSGTVT LAKTLQGVMI DQQRSLMAPE 
KRVRDVLADG SDWIDVRGVR KHIQGYLKDF LFDPGLVEAR VGTLSGGERS RLLLAREFAR 
KSNLLVLDEP TNDLDLETLD LLQEVIADYD GTVLIVSHDR DFLDRTVTIT LGMDGSGRVD 
IVAGGYADWE KMRKSRGAGA AKAASPREAG APPPPPPPPP AKKGKLSYKD QRDYELLPTR 
IEELEAAIAR GEAQLADPDL YARDPKKFDA LMAALEKVRG EKEAAEERWL ELAEMVEG