Gene Saro_3891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3891
Symbol
ID	5077375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	59987
End bp	61306
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	640480998
Product	coenzyme F420-dependent N5 N10-methylene tetrahydromethanopterin reductase-like protein
Protein accession	YP_001165660
Protein GI	146275499
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.68944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAGC AACTTCACCT TGGCGCGTTC ATGCGCCCGG TCAGCATCCA CACCGGAGCT 
TGGCGGTATC CAGGTGCCTT ACCCGACGCG AACTTCAGCC TGGCAGCGAT CCAGCGCTTC 
ATCCGCAGCC TTGAAGCTGC CAAGTTCGAT TATTTCTTCA TGGCCGATCA CCTCGGCGTG 
CTCAACCTGC CACGCCAGGC GCTGATGCGC AGCCACACGG TGACCTCGTT CGAGCCATTC 
ACGTTGCTTT CCGCACTGGC CGGGGTGACT GAGCGAATCG GCCTCGTCGC AACGGCCTCG 
ACCACTTACG ACGAGCCGTT CCATGTCGCG CGCCGCTTTG CCTCTCTCGA TCACATCAGC 
GGCGGGCGGA CCGGCTGGAA CGTGGTGACC ACTTCGAATC CGGACAGCAG CCGCAACTTC 
GGCCTGGAGA CCCAGCCAGA TCACGCCGCG CGCTATCACC GCGCCCGCGA GTTTCATGAC 
GTTGTGACCG GGCTGTGGGA CAGTTTCGCT GACGATGCCT TCGTTATGGA CGCAGCAAAG 
GGCATCTATT TCGACCCCGA CCGAATGCAT GCGCTGAACC ACAAGGGCGA GCATTTCTCG 
GTCACCGGGC CGCTTAACAT CGCGCGTCCG GTTCAGGGCT GGCCGGTCAT CTTCCAGGCC 
GGTGCCTCTG ACCCGGGCCG CCAGCTCGCT GCCGAAACTG CCGAAGCCGT ATTTGCTGCG 
GAATCGACGC TGGAAGGCAG CAAAGCCTAT TACGACGACG TCAAAGGGCG GGCGGCGACG 
GTCGGACGCA ATCCCGATCA CATCAAGATC ATGCCGGCCG TATTCCTGGT TGTTGGAGAC 
ACCGTCGAGG AAGCCCACGC GAAGCGCGCG AAACTGGACA GCCTGGTCCA CTACGACAGC 
GGCATCCATT CACTGTCTGG CATGCTGGGT CACGACGTAT CGGGCTTCGA TCCCGACGGC 
CCCCTGCCCG ACATCCCCGA ATCCAACGCC AGCAAAAGTT CGCGGCGGTT CATGATCGAA 
TTGGCCAGAG CTGAGAACCT GACGATCCGC CAGCTCGCCG CGAAGGCTGG CAGCTATGGC 
GGTTTGGCCT TTGTCGGCAC CGCCAAGACC ATCGCCGACG AGATGCAGCA TTGGCTTGAG 
CAAGGCGCTT GCGACGGTTT TACCACCATG TTCCCTTACC TGCCCGAAGG CCTGGAAGAC 
TTTACCGGCA AGGTTGTACC CGAACTGCAG GCGCGCGGCC TGTTCCGCAC CGAATACGAA 
GGCGAAACGC TGCGCGACCA TCTTGGCCTG CCGCGCCCGG ACAACCGCTT CTTCGCCTGA

Protein sequence

MAKQLHLGAF MRPVSIHTGA WRYPGALPDA NFSLAAIQRF IRSLEAAKFD YFFMADHLGV 
LNLPRQALMR SHTVTSFEPF TLLSALAGVT ERIGLVATAS TTYDEPFHVA RRFASLDHIS 
GGRTGWNVVT TSNPDSSRNF GLETQPDHAA RYHRAREFHD VVTGLWDSFA DDAFVMDAAK 
GIYFDPDRMH ALNHKGEHFS VTGPLNIARP VQGWPVIFQA GASDPGRQLA AETAEAVFAA 
ESTLEGSKAY YDDVKGRAAT VGRNPDHIKI MPAVFLVVGD TVEEAHAKRA KLDSLVHYDS 
GIHSLSGMLG HDVSGFDPDG PLPDIPESNA SKSSRRFMIE LARAENLTIR QLAAKAGSYG 
GLAFVGTAKT IADEMQHWLE QGACDGFTTM FPYLPEGLED FTGKVVPELQ ARGLFRTEYE 
GETLRDHLGL PRPDNRFFA