Gene Saro_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1843
Symbol
ID	3918403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1943572
End bp	1944699
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	65%
IMG OID	640444585
Product	alanine dehydrogenase/PNT-like
Protein accession	YP_497117
Protein GI	87199860
COG category	[C] Energy production and conversion
COG ID	[COG3288] NAD/NADP transhydrogenase alpha subunit
TIGRFAM ID	[TIGR00561] NAD(P) transhydrogenase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.226414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGGGG CAATGAAGAT CGCCGTCCTC AGGGAACGCG CGACGGGGGA GACCAGGGTT 
TCGGCAACGC CGGAAACCGT GAAGAAGTTC ATTGCCCTTG GGGCAACAGT TGCAATTGAA 
GAAGGTGCAG GCATTACCGC CTCGATTTCC GACGAGGATT ATCGCGCGGT GGGCGCCGAA 
GTCGTGTCCA GTCCGGCAAA CGGGGCGGAC ATCGTGCTTG GCGTCCAGGG CCCCGAGCCC 
GAACTGCTGG CGGGCGTGAA GCCCGGTGCC TGGATCGTGG CCGGGCTTGA TCCATTCGTG 
AAGCGCGCCC GCGTGGACGC TTATGCGGCC GCCGGCCTTG AAGCGCTGGC GATGGAGTTC 
ATGCCGCGCA TTACACGTGC ACAGTCGATG GACATCCTGT CGTCGCAGTC GAACCTTGCC 
GGCTACAAGG CCGTGCTGGT GGCCGCCAAC CTTTATGGTC GCGCGTTCCC GATGATGATG 
ACGGCGGCGG GCACCGTCTC TGCCGCCAAG GCTTTTGTCA TGGGCGTCGG CGTTGCCGGC 
CTCCAGGCCA TCGCCACCGC TCGCCGTCTC GGCGCGCAGG TTTCGGCGAC CGACGTCCGT 
TCGGCAACGA AGGAGCAGAT CCAGTCGCTC GGTGCCAAGC CGATCTTCGT GGAAAGCGTT 
GCGGGCATCG AAGGCGAGGG CGCCGGCGGC TATGCCACGG AAATGTCCGA GGAATACCAG 
AAGGCCCAGG CCGAGCTGGT GAGCGCGCAT ATCGCCAAGC AGGACATCGT CATCACCACG 
GCGCTGATCC CGGGCCGCGC CGCGCCGCGC CTGATTTCCG ATGCGCAGAT TGCCACGATG 
AAGCCCGGTT CGGTCATCTT CGACCTTGCC GTGGCCCAGG GCGGCAACGT CGAGGGTTCG 
GTGCCCGACC AGGTTGTCGA GAAGCACGGC GTGAAGATCG TCGGCTACTC GAACACGCCC 
GCGCACCTGC CGGCCGACGC TTCGGCGCTG TTCAGCCGCA ACCTCTACAA CTTCCTCTCG 
GCCTTCTGGG ACAAGGAACA GGGCAAGCCC GTTCTGGACG AGGAAATCGG CAACGCCATC 
CGCCTGACGC AGGGCGGCAA GGTGGTCAAC GAACGTCTGC TCGGCTGA

Protein sequence

MAGAMKIAVL RERATGETRV SATPETVKKF IALGATVAIE EGAGITASIS DEDYRAVGAE 
VVSSPANGAD IVLGVQGPEP ELLAGVKPGA WIVAGLDPFV KRARVDAYAA AGLEALAMEF 
MPRITRAQSM DILSSQSNLA GYKAVLVAAN LYGRAFPMMM TAAGTVSAAK AFVMGVGVAG 
LQAIATARRL GAQVSATDVR SATKEQIQSL GAKPIFVESV AGIEGEGAGG YATEMSEEYQ 
KAQAELVSAH IAKQDIVITT ALIPGRAAPR LISDAQIATM KPGSVIFDLA VAQGGNVEGS 
VPDQVVEKHG VKIVGYSNTP AHLPADASAL FSRNLYNFLS AFWDKEQGKP VLDEEIGNAI 
RLTQGGKVVN ERLLG