Gene Saro_3026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3026
Symbol
ID	3916637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3235845
End bp	3237056
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	59%
IMG OID	640445805
Product	hypothetical protein
Protein accession	YP_498295
Protein GI	87201038
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.85184
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGAGAA CGAAGCGCTC GAAGCCGCTC TATCAGCGCG GCCCCTTCGC CCTCTATCGC 
CGCCCCGATC GCACGAACCT CGAAATCGTC TGGTACGATG CCGAGCGCAA GCGTGAACGA 
TGCATTAGCG CGGGCACAAG CGATGTTGGG GAAGGCAGCA AGGCCCTAGA TCGCTGCTAC 
CTCAAGGAGC AGGGAAACCA CGTCTGCCCC AACTGCGGCA GAGCGATGGA AGGCGAAGCT 
GCGCCCTTAC TGGCAAGTGC CATCACTGAC TATCTGACCA TTTCCGAAGG AAAGGCTGGA 
TATAAGGCAT CTAAGACCCG GCTTTCACAT GTCGTTGGAT ACCTTGCAGC AACCAATCCC 
GCCGTCACCC TACCCATGAT TTCGCGGGAT TGGGTAGAAG GTTTCCGGAA GTGGATGCGC 
GGTAAAGATT ACGCCCCCGG CCATATCGAG GGATGCGTTC TGCAACTCGC CGCAGCGATC 
AATTCGGTCC ATGGCCATCA GGCGCAATTC AAAGCCCGCT CCGTAAAGGA CGCGGCCCGC 
TCTCCAGTTT ATCGGGCAAG CGTTGAGGAG CTTGCGGCCA TGTTCCGCTT CTGTATCGAT 
CCGCCCGCGC CCAAAGGTAG GCAGTGGAGC GACAAGGAGC GCGCCATGGT CATCGCCACC 
CGCGAGAACC TTTTGCGGTA TCTGCGAGCT GCTGTCGCAA CATGGGCGCG GCCAGACGCG 
ATCTTTGATC TCAAGGCCAA GGGGCAATGG CATAGCGCGG CAGGGGTTCT TGATCTGAAC 
CAGCCAGGCC GACCGCAAAC CAAAAAGTAC CGCCCCATCA TACCAGTCGC GCGGCAGTTT 
CGGCCTTGGC TTGATGAAGC GCTTGCCCGC GAAAGCTACA TCCCCGTCAG CACTGTGCGT 
CATGGATGGG CGTCAATGCG GATGCACCTT AAGTTACCGA CAGGGCGCGA GGCAGGCGAA 
AAGCTTATCC GCAGGAGCAT GGCAACCATA TGTCGCAAGC TCATCGGAGA GGCGAATTGG 
GCGCAGGGCG AAATGATGCT CGGGCACCGG AAATCGAGCA TTTCCGACAT TTACGCCATT 
GTTGATCCCG CGAATCTCGG CCTCGCTCTG GAGGCCACAG AAACGGTTAT TGACCGTATC 
GAAGCCTTGA CGCCGGGTGC GTTTTGCCGC ACTCTTACCG CAGAAGCCTC CCCGCTTCGA 
GTTGTGAAAT GA

Protein sequence

MPRTKRSKPL YQRGPFALYR RPDRTNLEIV WYDAERKRER CISAGTSDVG EGSKALDRCY 
LKEQGNHVCP NCGRAMEGEA APLLASAITD YLTISEGKAG YKASKTRLSH VVGYLAATNP 
AVTLPMISRD WVEGFRKWMR GKDYAPGHIE GCVLQLAAAI NSVHGHQAQF KARSVKDAAR 
SPVYRASVEE LAAMFRFCID PPAPKGRQWS DKERAMVIAT RENLLRYLRA AVATWARPDA 
IFDLKAKGQW HSAAGVLDLN QPGRPQTKKY RPIIPVARQF RPWLDEALAR ESYIPVSTVR 
HGWASMRMHL KLPTGREAGE KLIRRSMATI CRKLIGEANW AQGEMMLGHR KSSISDIYAI 
VDPANLGLAL EATETVIDRI EALTPGAFCR TLTAEASPLR VVK