Gene Sare_4226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4226
Symbol
ID	5704397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4797767
End bp	4798930
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	71%
IMG OID	641273645
Product	IMP dehydrogenase family protein
Protein accession	YP_001538998
Protein GI	159039745
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0516] IMP dehydrogenase/GMP reductase
TIGRFAM ID	[TIGR01304] IMP dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.311533
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGACG TGGTCGAGAT CGGGCTGGGC AAGACCGCGC AGCGCGGCTA CCACCTGGAC 
GACATCGCGA TTGTGCCGAG CCGTCGCACC CGGGACGTGG ACGACGTGTC GACAGCCTGG 
CAGCTCGACG CGTACCCGTT CGACATTCCC TGCGTCGGCC ACCCCTCCGA CGCGACGATG 
AGCCCCGCCT CGGCGGTCCG GCTCAGCCAG CTCGGCGGCC TCGGCGTGCT CAACGTGGAG 
GGTCTGTGGA CCCGCTACGA GAACCCGACG AAGGTACTGG AGGAACTGGC CAGCCTGGGC 
GTGGACGCCT CGGGCCCGTC ACCACGTACC CCCCGCGCCG CCGCGGCCCG GCCCCGCCAC 
ACCCGGCGGC TCCAGGAGGT GTACGCCGAG CCGATCCGCG CGGACCTGAT CGCCGAGCGG 
GTCCGAGAGC TGCGGGCCGG CGGTGGGACG GTGGCGGTAC GTGTCTCACC GCAGCACACC 
CTGGCGCTCG CCCCGGTGAT CCTCGACGCC GGGGTGGACA TCCTGGTGAT CCAGGGCACC 
ATCGTCTCCG CCGAGCACGT CTCCACCACC GACGAGCCGC TGAACCTCAA GGAGTTCATC 
GCCGACCTCG ACCTACCGGT GGTCGTCGGC GGCTGCACCG ACTACAAGAC CGCTCTGCAC 
CTGATGCGTA CCGGTGCGGC CGGGGTGATC GTCGGTATCG GCGGCGACGA CTGGTCGACC 
ACCGAATCGG TGCTGGGGAT CCGGGTGCCG ATGGCCACCG CGATCGCCGA CGCCGCCGCG 
GCCCGTCGGG ACTACCTGGA CGAGACCGGC GGCCGGTACG TACACCTGAT CGCCGATGGC 
GATATCCGGA CCTCCGGTGA CATTGCCAAG GCGCTCGGCT GCGGCGCCGA CGCGGTGATG 
CTGGGCGAGC CGCTCTCGCT GTGCCCCGAG GCGCCGGCCG GTGGCGCCTG GTGGCACTCG 
GCCGCCAGCC ATCCAGCTCT GCCCCGGGGC GCCTTCGAGG TCGCCGGAGA GCCGTTCGGC 
TCGATGGAAC AGCTGCTGTA CGGACCGGCC GACGAGCCGG ACGGCCAGCT CAACCTCTTC 
GGCGGGCTAC GCCGGGCGAT GGCCAAGTGC GGCTACCGTG ACCTCAAGGA GTTCCAGAAG 
GTCGGCCTGG TCCTGGACCG CTGA

Protein sequence

MRDVVEIGLG KTAQRGYHLD DIAIVPSRRT RDVDDVSTAW QLDAYPFDIP CVGHPSDATM 
SPASAVRLSQ LGGLGVLNVE GLWTRYENPT KVLEELASLG VDASGPSPRT PRAAAARPRH 
TRRLQEVYAE PIRADLIAER VRELRAGGGT VAVRVSPQHT LALAPVILDA GVDILVIQGT 
IVSAEHVSTT DEPLNLKEFI ADLDLPVVVG GCTDYKTALH LMRTGAAGVI VGIGGDDWST 
TESVLGIRVP MATAIADAAA ARRDYLDETG GRYVHLIADG DIRTSGDIAK ALGCGADAVM 
LGEPLSLCPE APAGGAWWHS AASHPALPRG AFEVAGEPFG SMEQLLYGPA DEPDGQLNLF 
GGLRRAMAKC GYRDLKEFQK VGLVLDR