Gene Saro_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3159
Symbol
ID	3918201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3371606
End bp	3372700
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	640445943
Product	hypothetical protein
Protein accession	YP_498428
Protein GI	87201171
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGGC AGATATTCCT GCTGGCTGGC GCGGCGGCGT TGGCGATCGG TGCGCCCGCC 
CTCGCGCAGG GCAAGGGCGG TAACGGCGGC AATGGCAACG GCCAGGGCGG CGAGCACGGC 
GCGCAACATG GCGGCGGCGC AAAGGCGCAG GGCCAGGGCA ATCGCGGCGG CGGCGAGGCC 
GCAAAGGGTC CGGAACGCAA GATGGCCAGC GTCCAGCCCG GACGGAGCGA CAAGGCCTCG 
CCGGCCAAGG CAGAGCGCGG GCCCGACCGC GCGGTTGCCG CCGCCGGCAA GGCAAACCGC 
AACGAGCAGG CCGATAGCCG TGCGATGGAG GACACCGCAC CCGGCCGGAG CGGCCAGGCA 
AAGGGCATCT ACAACGGCAA GGGACCTGGC AACAGCGCCG ACCTTGCGCG CGGCAATGCG 
CAGCGGGCCG CGCCCGGCAA TCTGCGCGAG GCCGCCCGGG TCGTCGCCAC GCGCCGCTGG 
GACGGCGGGC GCTATCGCTA TGACGACAGC CGCTATCTCG TCCCGGTAAG CGATTCCTGC 
CCGCCGGGGC TGGCGAGGAA AAACAACGGC TGCCTCCCGC CCGGGCAGGC GCGCAAGCTG 
GCGCCGACCG GCGGATGGTC TGGCTGGTAT CCCACCCGCT ACTTCGGCGA CGGCTACGAC 
TGGCGCTATG ACAACGGCTA TCTCTACCGG CTTGGCAACG GCGGGCTTGT CTCGGCCTTC 
GTGCCGCTGC TGGGCGGCGC CCTGTTCGGC GGCAATATCT GGCCTTCGCA GTACACCAGC 
TACGAGGTGC CAGCCTATTA TGACCGCTTC TACGGCTACG ATGACGACTA CGATTATCGT 
TATGCGCAGA ACGCCATTTT CGCAGTCGAC CCCGAGACGC AGCAGATCGA GGCAATCGCG 
GGTCTCCTGA CCGGCGATCC GTGGTCGGTC GGGCAGGCGA TGCCGCTCGG CTACGACATC 
TACAACGTGC CGCCAGCCTA CCGCGACCGC TACGTCGACG GGCCGGATGC CATGTACCGA 
TACAGCGACG GCTACGTCTA CGAGGTCGAC CCCACGACCC AGCTCGTGCG GGCCGTGATC 
GAACTGCTAG TCTGA

Protein sequence

MMRQIFLLAG AAALAIGAPA LAQGKGGNGG NGNGQGGEHG AQHGGGAKAQ GQGNRGGGEA 
AKGPERKMAS VQPGRSDKAS PAKAERGPDR AVAAAGKANR NEQADSRAME DTAPGRSGQA 
KGIYNGKGPG NSADLARGNA QRAAPGNLRE AARVVATRRW DGGRYRYDDS RYLVPVSDSC 
PPGLARKNNG CLPPGQARKL APTGGWSGWY PTRYFGDGYD WRYDNGYLYR LGNGGLVSAF 
VPLLGGALFG GNIWPSQYTS YEVPAYYDRF YGYDDDYDYR YAQNAIFAVD PETQQIEAIA 
GLLTGDPWSV GQAMPLGYDI YNVPPAYRDR YVDGPDAMYR YSDGYVYEVD PTTQLVRAVI 
ELLV