Gene Saro_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1961
Symbol
ID	3917277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2079602
End bp	2080741
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	640444709
Product	ErfK/YbiS/YcfS/YnhG
Protein accession	YP_497235
Protein GI	87199978
COG category	[S] Function unknown
COG ID	[COG1376] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.975073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACGCC ACACAGCTGC CGCGCTCGCC ATCCTAGCCC TTGCCGCTTG CCAATCGGAG 
AAGTCGGACC CCGCTCCCGA TAAAAGCGCG GCAGCGCAGC CAGCGAAGCC AGCGTTCGTC 
GTGCCCATGG CTTCGAGCGA TCCTGCGCCC GGCCAGCCCG CACCGGCCGA GGACATGCCG 
CGGCCGGTGA TGCAGGCACA GGTCGTACTC GAACGGCTTG GCTTTGCGCC CGGGATCATC 
GACGGCAAGG AAGGACTGAG CACTCGAAAC GCGGTCCAAG GGTTCCAGGA AGCCAATGGC 
ATTGCCGTCT CTGGCAATTT CGATCGCGCC ACGATGCAGG CGCTCGCCCG CTGGTCCAAC 
ATACCCGCCA CCCGCCTGGT CACCATCCCG GACGATTTCG CGCACGGTCC GTTCGCGCCG 
TTGCCAAAGG AACCTGCAGC CCAGGCGAAG CTGAAGGCTT TGGGCTACGC CTCGCTCGAG 
GAAAAGCTCG CCGAGCGCTT TCATACTACG CCTGAAGTGC TGCGCGCTCT CAACGCACCT 
CCGGTGCAGC AGCCGATTGC GTCAAGCGCT GCGGTGGAGG CAACGAGGCG AACGCCGGTG 
ATCTATCGTG CGGGCCAGCA GATCAGGGTT CCGAATGTCG GCGCCGATGC CATCGATCCT 
GTGGCGGTCG GGGACCAGGG CGCACTCGAA ACCATGGCTT CGCTCGGCGT CGGTTCGAAC 
CAGCCCAAGG CGGGGCGCAT CGTTGTGAGT GAACACGCGG GGACGCTGAA AGCCTTCGAC 
GCATCGAACA AGCTTGTCGC GCTTTTCACC GTCACCACCG GTTCCGAACA CGATCCGCTG 
CCGTTGGGGA ACTGGAAGAT CTACTCTTCC TCGTTCAATC CTCATTTCCG TTATGACGCC 
AGCCTGTTCT GGGACGTCCC CGACAGCAAG GGCGAGCATC TCCTGCCGCC GGGGCCCAAT 
GGACCGGTGG GTGTAGTGTG GATCGACCTG TCGAAGGAGC ACTATGGCAT ACATGGCACC 
CCGGAGCCGC AGACCATCGG CCGGACGGAA AGCCACGGCT GCGTCCGCCT CACCAATTGG 
GATGCCGCGC GGCTCGCGCT CATGGTCGAC GGCGCGACGA AGGTTTCATT CGTAAGGTGA

Protein sequence

MLRHTAAALA ILALAACQSE KSDPAPDKSA AAQPAKPAFV VPMASSDPAP GQPAPAEDMP 
RPVMQAQVVL ERLGFAPGII DGKEGLSTRN AVQGFQEANG IAVSGNFDRA TMQALARWSN 
IPATRLVTIP DDFAHGPFAP LPKEPAAQAK LKALGYASLE EKLAERFHTT PEVLRALNAP 
PVQQPIASSA AVEATRRTPV IYRAGQQIRV PNVGADAIDP VAVGDQGALE TMASLGVGSN 
QPKAGRIVVS EHAGTLKAFD ASNKLVALFT VTTGSEHDPL PLGNWKIYSS SFNPHFRYDA 
SLFWDVPDSK GEHLLPPGPN GPVGVVWIDL SKEHYGIHGT PEPQTIGRTE SHGCVRLTNW 
DAARLALMVD GATKVSFVR