Gene Saro_3741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3741
Symbol
ID	5077889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	379356
End bp	380303
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	65%
IMG OID	640481464
Product	dehydrogenase, E1 component
Protein accession	YP_001166126
Protein GI	146275966
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.418325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGGGC CGGACCCTGC GCTGCTTGAA AGCATGTTTC ACAAGTTGGC CGTCTCGCGT 
GCGGTCGAGA CGTTGATGTT GCGCCACACG CGGGAAGAGC GCTTCTCCGG TTGGTGGCAT 
CCGGGTGAGG GGCAGGAAGC CGCGCCGATC GGCGCCACGG CTGCGCTCGA AGCTGACGAT 
TACGTCTGGT ATCAGGGCCG CGGCTGCGCC TGGGCAATCG GAAAGGGCAT GGACCCGCTA 
CCAATCCTTG GCGACCTCCT TGGCAAGACG AATGGCGCAA CGGGCGGCAA GGGTGGTGGA 
GTCCCGCACT GGGCAGACTA CAGCCTTGGC ATCATGGGCG AGGGCGCGAC GCTTGGTTCC 
GTCTATCCGC TTGCGGCCGG TTCTGCCCTT GCCTCGAAGA TCCGCAAGGA CGGCCGTGTC 
AGTCTCGCCA ACTTCGGTGA CGGCACTGCC TCGCGCGGGA CGTTCCATGA AACCATGATG 
CACGCGGCCG CTTGGAAGTT GCCACTGATC TACTTCTGCG AGAACAACGG CCTCCTTGTC 
GGCACGCGGA CCGAGCAGGT CTCGGCGACC GCCGACATCG CGAACCTTGC CAAGGGCTAT 
GGCATTCCCG GGGTGATCGT CGACGGGCAG GACGCGGTCG CCGTCTGGGA AGCAACGCGC 
GAAGCGGCGG CCCGCGCCCG GGCCGGGAAG GGGCCGACCC TCATCGAGGC AAAGGTTACC 
CGCAAGCACG GCCACTACGC CGGCGATCCT CAGCACTATC GCGACCCGGA CTATCTCAGG 
GATTATCGCG ATCCGCTGGA CCTTCTCGCC GCAAGGCTGG CCGGAAACGT TGCTGCGCGC 
ATCGTCGAGC AGGCCGATGC GGAAGTGGCT GCCGCTTATG AAGCGGCCAG AGCTGCGCCC 
GAACCCGATG TCTCGGTGAT CGAGAGGGAC CTTTACCATG TCGTCTGA

Protein sequence

MSGPDPALLE SMFHKLAVSR AVETLMLRHT REERFSGWWH PGEGQEAAPI GATAALEADD 
YVWYQGRGCA WAIGKGMDPL PILGDLLGKT NGATGGKGGG VPHWADYSLG IMGEGATLGS 
VYPLAAGSAL ASKIRKDGRV SLANFGDGTA SRGTFHETMM HAAAWKLPLI YFCENNGLLV 
GTRTEQVSAT ADIANLAKGY GIPGVIVDGQ DAVAVWEATR EAAARARAGK GPTLIEAKVT 
RKHGHYAGDP QHYRDPDYLR DYRDPLDLLA ARLAGNVAAR IVEQADAEVA AAYEAARAAP 
EPDVSVIERD LYHVV