Gene Saro_3239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3239
Symbol
ID	3917497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3460109
End bp	3461353
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	67%
IMG OID	640446023
Product	hypothetical protein
Protein accession	YP_498508
Protein GI	87201251
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCACGGC ACCTTGAAAT GACCGCACGG AATGTGACGG AAGCGCCGCA CGAGACGTTG 
TTGCTGCGCA TTTGCGCTGC GCCGGATGCT GACCACGAGA TGGCGTTTCG GGGGCTGGAC 
GAGGAGGGCT GGAGCGACCT TGCCGCGCTC GCGGAGGACA AGCGCGCTGC GCCCCTGGTC 
CGCCGGAGCA TCGCGATCGC GGGCATCCAG CCGATCGTTC CTGCGTCTGC CTTGCAGGAG 
ATCGACCGGG CCTGCCAGTG GCACGCGCTC TATGGCCTGC GTCAGGCGGT CGCGCTGAAG 
CGGCTCATCG GGGTTCTGGC GCAGGGTGGA TTCCATCCGA TCGTGCTCAA GGGCCTCGGT 
CTGGCGCACC GCGACTATCC CGACCAGGCA TTGCGGCCGC TGCGCGACGT GGACTTGCTG 
CTGACGCCGG ACGAAGCACC CGCGGCGCAA GACCTGCTCC TGCGCACCGA AGGATACCGG 
CTGGCGCCCT GGGCGGGGAC CTATGGCGTG GAGTACGGGC ACCAGATGCC CGAACTGCAG 
GACGTGGAGT TCGAACTTAC CATCGAGGTC CACCACAGGA TCAACGCGCG GGGCTGGGCG 
CAGGAGCCCT TGTTGCTCGA GTTGATCCGC GGCGAGGCGA CCGAACTGAC CCTTCTCGGC 
GCACAGGTCC GCGTTCCTTC ATCGCGTGCG AACTTTCTCC ACCTGGTCGA ACATGCGACG 
CTCCACCATG CTTTCGAGAA TGGGCCGCTG GTGCTGGCCG ATCTGCATTT TCTTGTGCAG 
CGCAACGAAC TGGACTGGGG CTGGATCGAG GCAGAGGCGG CGCGGCTGGG CCTCGCCAAT 
TCGCTTCGCC TGCTGGCGAC GGTGGCTGCG GAGCTAGGCG CGGGCTGGCC GCCCGCGCAC 
CTGGCCAACA AGGAATGCGT GCCGGACCTG CACCTGGCAT CGGCGCATGT CGCGATGCTC 
CAGGACAAGG AGGCATCCGA GCGCAACAAG ATGATGCGGC GGCTGGAGGC GGAAACCAGC 
GGTGACAGCG GCTGGCGGGC GGCTGTTGCG CGGGCATTCC GGCCCAATCC CCACCAGCTT 
GCCGCCTTCG CCGGATCGCG GCACGACGAC TGGCGGCGGT GGCTGGGCTA TCCGGCGTGG 
CTGTTCAACC GCGCGCGGCG CTATCTGGTT GCCTCGCGGG ACGAGGTCGT GAGATCCGGA 
GCTGAGCGCG AGGCGGAAAT GGTCAACTGG CTCCGTCTCG GCTGA

Protein sequence

MPRHLEMTAR NVTEAPHETL LLRICAAPDA DHEMAFRGLD EEGWSDLAAL AEDKRAAPLV 
RRSIAIAGIQ PIVPASALQE IDRACQWHAL YGLRQAVALK RLIGVLAQGG FHPIVLKGLG 
LAHRDYPDQA LRPLRDVDLL LTPDEAPAAQ DLLLRTEGYR LAPWAGTYGV EYGHQMPELQ 
DVEFELTIEV HHRINARGWA QEPLLLELIR GEATELTLLG AQVRVPSSRA NFLHLVEHAT 
LHHAFENGPL VLADLHFLVQ RNELDWGWIE AEAARLGLAN SLRLLATVAA ELGAGWPPAH 
LANKECVPDL HLASAHVAML QDKEASERNK MMRRLEAETS GDSGWRAAVA RAFRPNPHQL 
AAFAGSRHDD WRRWLGYPAW LFNRARRYLV ASRDEVVRSG AEREAEMVNW LRLG