Gene Sare_4349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4349
Symbol
ID	5708417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4915825
End bp	4916799
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	70%
IMG OID	641273771
Product	hypothetical protein
Protein accession	YP_001539121
Protein GI	159039868
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03620] probable F420-dependent oxidoreductase, MSMEG_4141 family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAGAA CTTCTCCAGA TCGTACTGGT GACATCCACC ACCGGGAGAC CGACACGAAC 
GACAGTCACC GAGGGCTCGG TCGAGTCGGC ATCTGGACCA TGGCGTTCGA CTGGCAGCCA 
GCCGGGCTCG TCCGCGACGC GACCGCCGAG TTGGAGGAAC TCGGCTACGG TGCGGTGTGG 
TACGCCGAGG GCCTCGGCCG CGACGCGGTC AGCCAGGCAT GGCTCATCCT GGGCAACACC 
CGGCGGCTGG TCGTCGGAGC GGGCGTCGCC AACATCGCCA CGCGGGAACC AATCGCGATG 
GCCGCAGCCC ACCGTGCGCT GGACGACGCG TACGCGGGAC GGTTCGTGCT GGGACTCGGC 
GGACATCGAA CCCACGACAC CCCGACCAAC GCTATCCCCG GGCGCTACGG ACGACCGGTA 
CAGACGATGA CCGCCTACCT CGACGCCATG GACGCCGCCA CCACCGTGCT TCCCGAGCCA 
ACACCTCCTC GCCGCCGGGT CCTCGCCGCA CTCGGCCCCA GAATGACCGA ACTCGCCGCA 
CAACGCACCG AGGGCGCCCT GCCCTACTTC GCACCCGTCG AACACACCCG CCGCGCCCGG 
GAGGCCATGG GACCTGGTCC ACTGCTCGCA GTGGAACTCG CGGTCGCCCT CGCCGACGAA 
CCCGATCGCG GGCGCCAGCT GGCCCGCGAC CATGTCGCCT ACTACACCTC CACCGCCCCG 
CACCAGGCCG CCAATCTGCG TCGCCTGGGC TTCACCGAAC AGGACATGCG GGGCCTGAGT 
AGCACCCTGG TCGACGCCGT GGTCGCCCAC GGCGACCTCG ACACGGTACG CACCCGCGTG 
CGGGAGCACC TGGACGCGGG CGCAAACCAC GTCTGCATCC AGGTGCTCAC CGCGGATCCG 
GCCACGCTGC CCATGGACGA GTGGCGGGAG CTGGCGTTCC TCACCACCGA GGCGACGACA 
TCGAGGGTCG GTTGA

Protein sequence

MRRTSPDRTG DIHHRETDTN DSHRGLGRVG IWTMAFDWQP AGLVRDATAE LEELGYGAVW 
YAEGLGRDAV SQAWLILGNT RRLVVGAGVA NIATREPIAM AAAHRALDDA YAGRFVLGLG 
GHRTHDTPTN AIPGRYGRPV QTMTAYLDAM DAATTVLPEP TPPRRRVLAA LGPRMTELAA 
QRTEGALPYF APVEHTRRAR EAMGPGPLLA VELAVALADE PDRGRQLARD HVAYYTSTAP 
HQAANLRRLG FTEQDMRGLS STLVDAVVAH GDLDTVRTRV REHLDAGANH VCIQVLTADP 
ATLPMDEWRE LAFLTTEATT SRVG