Gene Saro_0463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0463
Symbol
ID	3918289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	506565
End bp	507851
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	71%
IMG OID	640443192
Product	hypothetical protein
Protein accession	YP_495745
Protein GI	87198488
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGCTGG CGGGCATCGC CCCGCTGGCG CTGCTCCTTG CCGCGACGAT TCCGGCCGCG 
TGGATCGCCG CGCCTGCGCT GGGCGGCGCG CTCGTGGTGG TGATCCTGCT CGACGGCCTG 
CTCGCGGGCC GTCTCGCGGA CCTGCGCGTG ATCGCGCCTG AGGATGCCGA AGTGGGCGAG 
CCCGCGCGGC TGGTCGTGGC GGCAGAGCTT GACCGTGCAT CGCCCCGCGC CCGCCCCGAA 
ATCGCGCTCG AATGCGACCC CCGCCTTGCC CCCGGCGGCA GGCTGGCCTT CGCGCTCATC 
CCGGATGGCG GCGCTTGGAC CGGCGCGGGC GAAATCAGTC CGACCCGGCG AGGTACCGGC 
GTGTTCGGCC GCGTCTGGCT GCGCTGGTCC GGGCCGCTGG GCCTTGCCCA CCGCCAGGTG 
AGCCGCCCGC TCGACCAGTC CGTCCGCGTC TGGCCCAATA TCGCACCGGT GCGCAGCCCC 
GCGCTCCAGA TCTTCCTGCG CGATGCGCAG TTCGGCCTGA TCGCACGCCG CATCCGCGGC 
GAAGGCGCAG AGTTCGAGGC CCTGGCCGAA TACGAACCGG GGATGGACCG CCGCCGCATC 
GACTGGAAAA GCTCGGCCCG CCACGCCCGC CTCTTTGCCA AGGAATACGA GGTCGAGCGC 
AACAACCAGA TCGTCTTCGC GTTCGACTGC GGGCAGACCA TGTGCGAGCC GATCGATGGC 
CTGCCGCGCA TCGACCGCGC CGTCACCGCC GCGCTGACCA CCGCCTATGT CGCGTTGAAG 
GCGCAGGACC GCGTCGCCCT CTTCGGCTTT GCCGCTAGGC CCGAAGTCGC CACGCCCTTC 
ATCACCTCAA GCCGCGACTT TCCCCGCCTC CAGCGCGCTG CCGCAGGGCT CGACTATCAC 
CCGGGCGAAG CGAACTTCAC GCTTGCCCTG TCGACGCTGG CCGCACGGCT CCAGCGGCGC 
TCGCTGATCG TGCTGTTTTC AGACTTCACC GACCCCACCA GCGCCGAACT GATGGTCGAA 
AGCGTCGGCC GCCTCGTCGA GCGGCACCTC GTCCTGTTCG TGGTGATGAC CGACGCCGAT 
CTTGCCCGGA TCGTGTCGGC CCCGGTGGAG GACATGCAGT CCGTCGCCGA GTCCGTCACC 
GCCACCACGC TCGTGCGCCA GCGCGCGCTC GTGCTGCAAC GTCTGCGCCA CCTTGGCGTT 
CGCGTGCTGG AAGCGCCGCA TGACGCCGTG GGGACGCGGC TCCTCGACGC CTATCTCGCG 
ATCAAGCGCG AGGGGAGGAT CGGATGA

Protein sequence

MVLAGIAPLA LLLAATIPAA WIAAPALGGA LVVVILLDGL LAGRLADLRV IAPEDAEVGE 
PARLVVAAEL DRASPRARPE IALECDPRLA PGGRLAFALI PDGGAWTGAG EISPTRRGTG 
VFGRVWLRWS GPLGLAHRQV SRPLDQSVRV WPNIAPVRSP ALQIFLRDAQ FGLIARRIRG 
EGAEFEALAE YEPGMDRRRI DWKSSARHAR LFAKEYEVER NNQIVFAFDC GQTMCEPIDG 
LPRIDRAVTA ALTTAYVALK AQDRVALFGF AARPEVATPF ITSSRDFPRL QRAAAGLDYH 
PGEANFTLAL STLAARLQRR SLIVLFSDFT DPTSAELMVE SVGRLVERHL VLFVVMTDAD 
LARIVSAPVE DMQSVAESVT ATTLVRQRAL VLQRLRHLGV RVLEAPHDAV GTRLLDAYLA 
IKREGRIG