Gene Saro_2942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2942
Symbol
ID	3917377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3158785
End bp	3160533
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	67%
IMG OID	640445720
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_498211
Protein GI	87200954
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGC ATGTCGAAGT CCGCAATCTG CGCATCGGCG TTGGCGACAA GGCCATCGTC 
GACGGCGTCT CGTTCGAGAT CCCGCGGGGC GAAGTTCTTG CGCTGATTGG CGAATCCGGC 
TCCGGCAAGA CTACGATCGC CCTTTCGCTG ATGGGTCATG CCCGTTTTGG TGCGAAGATC 
GAGGGCGAGA TCCGCCTTGG CGATACCCGC ATCGACCAAC TCGATGAAGC GGGTCTCCAG 
GCCTTGCGTG GGCGGCGCGT CGCTTACGTC GCGCAAAGCG CCGCGTCCGC GTTCAACCCC 
TCGCTCACGA TCATGACACA AGTGACCGAG CCCTTGCTCG TGCACGGCCT TGCGACGAGG 
GCGGAAGCTG AGGCCAAGGC CGTGGCCTTG TTCAAGGCGC TTGCGCTGCC GCATGCCGAA 
ACCATCGGTG CTCGCTATCC GCACCAGCTT TCGGGCGGCC AGCTCCAGCG GCTGATGGCG 
GCTATGGCGC TGATCACCGG CCCGGAACTC GTCATCCTCG ACGAACCCAC CACAGCCCTT 
GACGTGACCA CGCAGGTCGA AGTCCTGAGG GCATTCAAGG CCGCAATCGG CGCGGTCGGG 
GCAACCGCGA TCTACGTCAG TCACGACCTT GCCGTCGTCG CGCAGATGGC CGACCGGATT 
CTCGTGCTGA ACCAGGGGCA GACGCGCGAA CAGGGCGCGG CGGAGCAGAT CCTCCACGCC 
CCGCAGGACG ACTATACCCG CACGCTGATG GCGGCCGCGC GTCCCCACGC TCGCACCGCC 
CCCGCGAGGG TTGCCGATGT GCCGTTGCTG CGCGTCGAAG GCGTCCACGC CGCCTATGGC 
AAGGTGCCTG TGCTGCGCGA CATCTCGCTC AACCTGGCGA AAGGCGCGAC GCTTGGCGTG 
ATCGGCGAAA GCGGGTCGGG AAAGTCGACC CTTGCCCGCG TGATCGCCGG TCTCCTGCCG 
CGCAGTGCCG GTTCGGTCAG CGTCGATGGC GAAGAGCTGC CGCGCGGTCT CGACGGCCGC 
AGCCGCGAGC AGTTCCGGCG CGTGCAGCTT GTCTTCCAGA ATGCCGACAC GGCGCTGAAC 
CCGGTCCATA CCGTCGGCCA GACGCTGGCG CGGCCGCTGG CGTTCTATCA TGGTCTCACT 
GGCGCCGAAG GCAGGGCGGA AGTTGCGCGT CTGCTCGATC TGATTCGCCT GCCCGCCGCT 
TTCGCCGACC GCAATGTCCG CCAGCTCTCC GGCGGCCAGA AGCAGCGCGT CAATCTTGCC 
CGGGCTCTCG CCGCGCGGCC CGACGTGCTG TTGTGCGACG AGGTCACGTC CGCGCTGGAT 
ACCGTCGTGG GCGCGGCGAT CCTCGAACTG ATCGACGAAC TGCGCCGGGA TCTCGGCATC 
GCCACCGTGT TCATCAGCCA CGACATTTCG ACCGTCCGTG CCTTTTGCGA CAAGGTGCTG 
GTGCTTTATG GCGGCACGGC CGTGGAGCAG GCCGATGCCG CAGCTTTCGC GCGCGGCCCG 
CACCATCCCT ACACGACGCT GCTCATGGAT TCGGTGCCCG AGATGCGTGC CGGCTGGCTG 
GAGCAGGCCG GAGCCCGCCC CGCGGCGCTG GCAGCATCTG ACCTCGACGG GCTCTGCCGC 
TTCCTGGGAC GATGTCCCGT CGCCATTTCC GGCGCGTGCG ACCGCCAGGC CCCGCCCGCG 
CGGACAGGAG ACGGTCTTGC GCTGCTTTGC CATCACGACT TTGAACGACT GGGGGAATTG 
ACCGCATGA

Protein sequence

MSAHVEVRNL RIGVGDKAIV DGVSFEIPRG EVLALIGESG SGKTTIALSL MGHARFGAKI 
EGEIRLGDTR IDQLDEAGLQ ALRGRRVAYV AQSAASAFNP SLTIMTQVTE PLLVHGLATR 
AEAEAKAVAL FKALALPHAE TIGARYPHQL SGGQLQRLMA AMALITGPEL VILDEPTTAL 
DVTTQVEVLR AFKAAIGAVG ATAIYVSHDL AVVAQMADRI LVLNQGQTRE QGAAEQILHA 
PQDDYTRTLM AAARPHARTA PARVADVPLL RVEGVHAAYG KVPVLRDISL NLAKGATLGV 
IGESGSGKST LARVIAGLLP RSAGSVSVDG EELPRGLDGR SREQFRRVQL VFQNADTALN 
PVHTVGQTLA RPLAFYHGLT GAEGRAEVAR LLDLIRLPAA FADRNVRQLS GGQKQRVNLA 
RALAARPDVL LCDEVTSALD TVVGAAILEL IDELRRDLGI ATVFISHDIS TVRAFCDKVL 
VLYGGTAVEQ ADAAAFARGP HHPYTTLLMD SVPEMRAGWL EQAGARPAAL AASDLDGLCR 
FLGRCPVAIS GACDRQAPPA RTGDGLALLC HHDFERLGEL TA