Gene Saro_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3641
Symbol
ID	5077789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	269328
End bp	270560
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	67%
IMG OID	640481364
Product	hypothetical protein
Protein accession	YP_001166026
Protein GI	146275866
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.421002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCTT CCGATACTGC AACAGAGCGC CTGCTTTCCG GCCGCGCCTG GGACGATTTC 
TGCGACACGC TGAAGGTGGC GGGGCGGCAC ATCGAAGCGG TGGACGGACC GCTTTCCGAC 
CTCGACCGCG CGGAATGGTA CCGCTTCATG ACCCGGCTCG CGCGGTCGAG CATGGAGCGC 
CTGCTGGAGA ACGCCGAGCC GACCCGCCCG CGCCTGCGCG ACATGGTGTG GCGCCAGTCG 
ATCAACGTCC AGACGGTCGA CCAGGACCAC CTGATGTGCC AGTTCGACGA AGCGCGCGAC 
TATCTGATCA CCGGCACGCG CGGCACCATC CCCTATTTCG TGATGGCGCT GTGCACCTGC 
CCCGCCCCTG CGGTACCGGG GGCCGAGGAC TGGGCCGGAC AGGGCGTGGA AGGGCTGGCG 
CGGTTCGATC CGTCGAACCT CAAGACCACC GGCTTTCTCC ATTCGGGCCA GATGAAGATC 
GAGGCCGACG GCAGCTTCGA GGTCGTGCTT TCGCAGAACG ATCCGGGCGA GGGGCGCAAC 
TGGTTGAAGC TGACGCCGGA CACGAACTGC ATCCTGATCC GCCTCGTCTG GTCGGACCGC 
CTGCGCGAGA CGGCACCAGC CATGAACATC GCGCGGGCCG ACAAGGCGGA GCCGGAACCG 
GTCACCCCGG CCCTGATCGC GGACAACCTG GCGTGGACCG CGCAGGCAGT GCTGGGCTAT 
GCCGAACTGG TCCGCAACTG GTGGCAGGGC AGCCAGGGCA ACTTCGCCGC GCGGCTCAAC 
CGGCTAGACT ACAGCCGCGC ACAGTACCTT TCCAACGGCG GCGTGCCCGA CCGGCACGTG 
GCCTTCGGCG GCTGGGAAAA GGGCAAGGAC GAGGCGCTGG TGATCGAGTT CACCCCGCCC 
GAGTGCGAAT ACTGGAACTT CCAGCTCTGC AACGTGTGGC AAGAGAACCT CGACACGTTC 
GAGGACGGCA ACGGCTGGAT CAACAACTAC CGCCACGTGG CCGAGCGCGA CGGGCGGGTG 
CGGGTGGTGA TTGCGGAATC CGATCCCGGC ATCGGCGGCA ACTGGATCAA CAGCTATGGC 
CATGAACGCG GCATCTGGGG TCTGCGGCTG GTCCTGACCG AACGGACCGT GCCGGTGAAC 
CTGTGGCGCC TGCCGCTGGC GGCACTGGAA GCGCGCGGGC GGGACGCACT CGATCCGGCG 
CAGGCGGTTC TGACCGGGCA GTTCGTGGAC TGA

Protein sequence

MSASDTATER LLSGRAWDDF CDTLKVAGRH IEAVDGPLSD LDRAEWYRFM TRLARSSMER 
LLENAEPTRP RLRDMVWRQS INVQTVDQDH LMCQFDEARD YLITGTRGTI PYFVMALCTC 
PAPAVPGAED WAGQGVEGLA RFDPSNLKTT GFLHSGQMKI EADGSFEVVL SQNDPGEGRN 
WLKLTPDTNC ILIRLVWSDR LRETAPAMNI ARADKAEPEP VTPALIADNL AWTAQAVLGY 
AELVRNWWQG SQGNFAARLN RLDYSRAQYL SNGGVPDRHV AFGGWEKGKD EALVIEFTPP 
ECEYWNFQLC NVWQENLDTF EDGNGWINNY RHVAERDGRV RVVIAESDPG IGGNWINSYG 
HERGIWGLRL VLTERTVPVN LWRLPLAALE ARGRDALDPA QAVLTGQFVD