Gene Sare_3976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3976
Symbol
ID	5705253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4517530
End bp	4518591
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	641273401
Product	hypothetical protein
Protein accession	YP_001538757
Protein GI	159039504
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2706] 3-carboxymuconate cyclase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0026302
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCGGGTC AGGGTGCGAT CGTCTATGTC GGTTGCTACA CGGTGGGTGC CGGAGGCCAC 
GGCGAGGGGA TCGTTGCCGC CCGTCGCGAC CTTGTCTCGG GTGCGCTCAC CCCGCTCGGC 
ACGGCCGCGG CGACTCCGGC GCCGTCGTTC CTCGCCCGGC ACCCGGAACT GCCGGTCCTG 
TACGCGGTCA ACGAGGTGAC CGACGGTGCC GTCAGCGCGT TCCGGGTCGC CTCGGACGGG 
GGCCTGACCG CGCTCGGCAG CCGACCCACG GGGGGCGCCG AGCCGTGCCA CCTCGCGGTT 
GCCCCGAACG GCCGGCACCT TTTCGTGGCC AACTACGGTG GCGGGAGCGT GGCGGTGTTT 
CCGCTCGATG GGCAGGGGAT GCCCGGGGAA CGCACTGACC TGGTTCAGCA TGAGGGCCAC 
GGCCTGGATC CGGAGCGGCA GCAGACGGCG CACACCCACA TGGTCGCCCC GGGCCGGGAC 
GGTTGGCCGC TGTTCGTGGT CGATCTCGGC ACTGACTCGG TCTACCTGTA CGAGTTCGAC 
GCCGCGCTGG GGCGGCTGGC GCCCCGGGCT TGCCGGGTGC CCACCGCCGC CGGTACCGGT 
CCACGGCATG TGGCCCGCCA CCCGGACGGG CGGCGCTGCT GGCTCGTCGG TGAGCTGGAC 
GGTTCTGTCG TCACCTACGA GTTCACCACC GAGGGTGCCC TGCGTCAGCG CGGTCGGGTG 
TCAGCCAGCG AGCGGCCGGG GCACATACAG CCCTCGGAGA TCGCGGTCGG GCCGGACGGG 
CGGTTCCTCT ACGTCGCGAA CAGGGGTGTC GGCACGATCG CCGTCTTCGC GCTCGACGGC 
GAACTGCCGG TGCGGGTCGC CGAGGTCGAC TCCGGCGGGG AGTGGCCCCG GCATTTCGCG 
CTGGTGGGCC CCAACCTGTA CGTGGCGGAC GAGCGGGCCG ACCTGATCGC GGTGTTTCGG 
GTTGACCCGG TGACCGGTGT GCCCGTACCG GCCGCTGAGC CGGTTGCTGT CCCGAGCCCC 
ACCTGTGTCC TGCCCTGGAC GGGACACGAC GACGCATCGT GA

Protein sequence

MAGQGAIVYV GCYTVGAGGH GEGIVAARRD LVSGALTPLG TAAATPAPSF LARHPELPVL 
YAVNEVTDGA VSAFRVASDG GLTALGSRPT GGAEPCHLAV APNGRHLFVA NYGGGSVAVF 
PLDGQGMPGE RTDLVQHEGH GLDPERQQTA HTHMVAPGRD GWPLFVVDLG TDSVYLYEFD 
AALGRLAPRA CRVPTAAGTG PRHVARHPDG RRCWLVGELD GSVVTYEFTT EGALRQRGRV 
SASERPGHIQ PSEIAVGPDG RFLYVANRGV GTIAVFALDG ELPVRVAEVD SGGEWPRHFA 
LVGPNLYVAD ERADLIAVFR VDPVTGVPVP AAEPVAVPSP TCVLPWTGHD DAS