Gene Saro_3642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3642
Symbol
ID	5077790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	270562
End bp	271830
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	67%
IMG OID	640481365
Product	hypothetical protein
Protein accession	YP_001166027
Protein GI	146275867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.222709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCG CCACACCCAG GCTGATCCAC ATCGACGACA TGGCCGATCC CGTCGTCACG 
CCCGAACTTG CCGCGTGGCG CGAGGGGCCG GACGACTTTC CCTGCCCGAT GACTGCCGAC 
GAAGTGCTGG CGCGCGCGAT GGCGGAAACG GGGCTCGACG ACTTTGGCGA GGATACCGGC 
TTTCGCACCC GGCTCGGCGT GATCCTCGAC GCGCTCTACG AGGACGAGGG ACTGACGCGG 
GGCGGCCGCG TGTTCGTGCT GCAACAGGCG GTGCGCGCGA TGGCCAACCG CCTGCGCGTG 
GAAGACCTGA TCCGGCGCCA CCCTGAAATC CTCGACGTGC CAGTGGAAAA GCCGATCTTC 
ATCGCCGGCC TGCCGCGATC AGGCACGACG CACCTCGTCA ACTGGCTGTC GCGCGACGAC 
CGGCTGGACA GCCTGACGCT GTGGGAATCG GAGGAACCGG TCGCGGGCCC GCCCCTGCCG 
CCGGGCGAGA CCGATCCGCG CATGGCCCGT TCTGCCGCGT ACTGGGGAGC GTTCGGCGCG 
CTCGTTCCGC ACATGACGGC GATGCACGAG ATGGCGGCGA ACGACATCCA CGAGGACAAC 
GAACTGCTGT TCATGGATAT GAACTGCTAC AACTGGGAGT TCTCCTGCCG CCTGCCGCGC 
TGGACCGCGC ATTACCTCGC CCATGACCGG ACGGCGTCCT ACGCCTACGA GCGCAAGGTG 
CTCCAGGCCA TAGCCTGGCA GCGGGGCAGG AAGAACGGCG TCCGCTGGCT GCTGAAATCG 
CCGCAGCACA TGGAAAACCT CGCCGCGATC AAGGCGGTGT TCCCCGACGC GACGATGGTC 
ATCACGCACC GCGATCCGGT GGACGTGCTG CGTTCGCTGA CCACGATGCT GGGCTATTCG 
GACCGGACCC GGCGCGACCC TGTCGACCCG CCGGGGCTGG CGCGGCTGTG GACCGGGCGG 
ATCGAGAAGC TGCTTCGCGA ATGCGTGGCG CAGCGCGACG CCTTCGGGCC GGAGCAGTCG 
ATCGACGTCG CGTTCCACGA ATACATGGCC GACCAGGAAG GCATGGCCCG GCGCATCTAC 
CGCCTCGCCG GGCTGGACCT GCCGCCCGAA ACAGAGGCGC GCCTGCTGGG CTACCTTTCG 
GAGAACCCGC GCCATGCCCA GGGCAAGGTC GTCTACGATC TCGAAGGCGT GTTCGGGGTC 
GACATTGCCG CGCTGCGCGA ACGCTTTGCC TTCTACTACG AACGCTTCCC CGTGAAGCAG 
GAGAACTGA

Protein sequence

MNAATPRLIH IDDMADPVVT PELAAWREGP DDFPCPMTAD EVLARAMAET GLDDFGEDTG 
FRTRLGVILD ALYEDEGLTR GGRVFVLQQA VRAMANRLRV EDLIRRHPEI LDVPVEKPIF 
IAGLPRSGTT HLVNWLSRDD RLDSLTLWES EEPVAGPPLP PGETDPRMAR SAAYWGAFGA 
LVPHMTAMHE MAANDIHEDN ELLFMDMNCY NWEFSCRLPR WTAHYLAHDR TASYAYERKV 
LQAIAWQRGR KNGVRWLLKS PQHMENLAAI KAVFPDATMV ITHRDPVDVL RSLTTMLGYS 
DRTRRDPVDP PGLARLWTGR IEKLLRECVA QRDAFGPEQS IDVAFHEYMA DQEGMARRIY 
RLAGLDLPPE TEARLLGYLS ENPRHAQGKV VYDLEGVFGV DIAALRERFA FYYERFPVKQ 
EN