Gene Saro_2736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2736
Symbol
ID	3916895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2960755
End bp	2963025
Gene Length	2271 bp
Protein Length	756 aa
Translation table	11
GC content	65%
IMG OID	640445514
Product	hypothetical protein
Protein accession	YP_498006
Protein GI	87200749
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGAGA TCGATCCCGT CATTCTGCAG CTTCAGGCGG ACCTGAAGCA GTATCGCTCT 
GACCTCACCG GCGCCCAGAG GCTCACCGAA ACGAAGCTCG CCGCCATCGA GGCTCGCGGC 
GTCGCGATGG GGCAGAACAT CCGCAAGGGC TTTGACCTCG CGAAGGGCGC GGCGATTGGC 
TTCCTCGCAA CGGTCAGTGT CGACGCGCTG ACACAGGCGG CCAAGCGCGG CCTCGATTAT 
GCATCCAGCC TCGGGGAAGT TGCGCAGCAA CTCGGCGTAA CCACGGACGC GCTTCAGGAA 
TATCGCTACG CCGCGTCGCA GGCTGGTCTT TCCCAGGAGG AAATGGACCA GGCGCTGTCG 
CAGCTCACCC GCCGCATTGG CGAGGCAGCG AGCGGGACAA AGGCGCAGGC CGAGGCCTTC 
ACGAAGCTCG GCATCTCGGT CAAGGACGCG AACGGGAACG TCATGGACGC CGGTCGGGCG 
ATCCCCATGA TCGCCGATGC GCTGCAAAAG ATCGAGAGCC CGGCCGAGCG CGCCGCGATC 
CTCATGGACT TGTTCGGACG CGCCGGCCAG AAGCTCGAAC CGCTGCTTTC GGGTGGTTCG 
GCGGCTGTGA ACGAGTTGCG CGACGCGGCG CACAAGCTCG GCATCGTCCT GTCGGAAGAC 
CAGATTCAAC GGGCGGACGA GACGGCGGAC AAGCTTTCCG CTCTCAAGCA AGTCCTTGAG 
GCGCGTATCG CGGGGGCAGT CTCGGACAAC GCCAGTGCGA TCCTCTCGCT TGCCAACGCG 
CTGGCCAGCG TCGTTGACTG GGCGGGCAAG GCCGCAGACG CCTACCGCCG GTTCAAGCTC 
GAACAGGGGC TGCGGGAATC GCAGGCGATG CAGACGGGCT GGTTCCGCTC CGATGCTGAC 
CGCGCCAAGG GCCAGCGGGA CGAGCAGCTG TATCGCTACG AAATTGCCAA GATGGACGGC 
AAGGTCGACA CGACCGGCGG CTTCCGGGAC TACCGCATCA CCGGGATCGG AGGCGCCAGC 
GCAACCCCAG CACCCGGGGC TGTCGCATCT GCGGCGACAA CTAAGAAGAC GAAGGCAGCT 
ACTGCCGGAC CTTCAGGCCC ATCTGCCGCC GAGATCATGG CCCGCATCGA CAGCCAGTTG 
GCGTCTATGG CGCAGCAGGC CCTGTCCGCG ATGGAGAGCG TCGCCAAGTC CGCCGATGAG 
CGTGCGGAAC TTGAACTGCG CAGCGTCGAG CTGGCGCGCG TTCGGGCCTT GCGAGAGGTT 
GACACTGACA CGGACCTTGA CCGGCTCGGC AAAGAGGGAG CGGCGAACCA GCGTGCGCGC 
CTCAAGACGC AGATCGAGGC GTTGGCCGAT GCCGAACGCG ACCGCATCGA GCAGCGCCGG 
AAGGCGGAAC TCGAACAAGA CGCCCGCGAC CTCGCCCAGG AACGCTACAG CACCGATCGC 
GACGGATTGC AGATCCAGTA CGATCTCGCG GACAGTCAGA CCGAGCGGAA ACGCCTTGCG 
CTCGAAATGC TCGACCTCGA GCTGCGCTAT CAGAAGGCGC TGCTCGAAGG CGTGATCGCT 
TCGGAAACTG CGACCGAGGC AGAGAAAAAG CGCGCTCAGG CGGCACTCGA CGGTCTTAAT 
GCAACAGCAT CCGGCAAGCG CGAGGCGGCC TCGCGGTCCA ACGAGACGCC GCTGGAAGCA 
TATCGTCGGA AGCTCGATCG CAGTCCGGAC GCGATCAACG AGCAAGTCGA ATCCTACGTC 
GTCGAAGAAC TCGACAACGT CCGCGACGGC ATCCGCGGTG CGCTGGAAAA GGCGATCGGC 
ACCGACGATC CGCTGATTTC TGGCCTGCTG AACCTCTTGA TCGAGCAGGT CATTCTGCGT 
CCACTCGCCG AAGCTCTGGC GAGCGCGTCC GGCGGGGGCG GCGGATTTCT CGGTGCCGTC 
GCGTCCGGCA TCGGCTCATT GTTCGGCCGA GCATCGGGCG GATACGTCGC GCCTGGCCAG 
ATGGTGCGGG TCAACGAAGG CGCGTCGCCG GGTCGCGTGG AAGGCTTCAT CCCGCAGGGC 
GGCGGACACA TCGTGCCGCT GGGCCGCATG AATGCGCTGC GCCAGGCAGG CGGTCAGAAG 
GTTTTTCAGA TCAGCATCGA CGCTCGCAAC AGCGTTACCC CCGACGGATT TGCGCGCGAA 
CTGTCGAGCC AAATCCTGCG CCAGGCCGCC GCGATGGACG GCCAGACTGC GCAAGCAGTC 
CTCAAGGCCG CGCCGGGCCG GATGAGCCAG TACCAGCGGG ACAAAATCTG A

Protein sequence

MPEIDPVILQ LQADLKQYRS DLTGAQRLTE TKLAAIEARG VAMGQNIRKG FDLAKGAAIG 
FLATVSVDAL TQAAKRGLDY ASSLGEVAQQ LGVTTDALQE YRYAASQAGL SQEEMDQALS 
QLTRRIGEAA SGTKAQAEAF TKLGISVKDA NGNVMDAGRA IPMIADALQK IESPAERAAI 
LMDLFGRAGQ KLEPLLSGGS AAVNELRDAA HKLGIVLSED QIQRADETAD KLSALKQVLE 
ARIAGAVSDN ASAILSLANA LASVVDWAGK AADAYRRFKL EQGLRESQAM QTGWFRSDAD 
RAKGQRDEQL YRYEIAKMDG KVDTTGGFRD YRITGIGGAS ATPAPGAVAS AATTKKTKAA 
TAGPSGPSAA EIMARIDSQL ASMAQQALSA MESVAKSADE RAELELRSVE LARVRALREV 
DTDTDLDRLG KEGAANQRAR LKTQIEALAD AERDRIEQRR KAELEQDARD LAQERYSTDR 
DGLQIQYDLA DSQTERKRLA LEMLDLELRY QKALLEGVIA SETATEAEKK RAQAALDGLN 
ATASGKREAA SRSNETPLEA YRRKLDRSPD AINEQVESYV VEELDNVRDG IRGALEKAIG 
TDDPLISGLL NLLIEQVILR PLAEALASAS GGGGGFLGAV ASGIGSLFGR ASGGYVAPGQ 
MVRVNEGASP GRVEGFIPQG GGHIVPLGRM NALRQAGGQK VFQISIDARN SVTPDGFARE 
LSSQILRQAA AMDGQTAQAV LKAAPGRMSQ YQRDKI