Gene Sare_2112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2112
Symbol
ID	5704966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2432930
End bp	2434333
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	70%
IMG OID	641271597
Product	hypothetical protein
Protein accession	YP_001536968
Protein GI	159037715
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0819565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0120875
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG TGATCGCCGT CCAGCCCTCG CATGCCCACC TCTGGCCCAT CACGCCGGTA 
GCGTGGGCGT TGCAGAGCGC GGGCCACGAG GTACGCGTCG CCACCCACGC CCGGTTCGCC 
GATTCGGTCC GGGCCGCCGG ACTGACCCCG GTCGGTCTCG GTGACCCGGC GGCCGACGAG 
GCCCGTACCC GCTCGGACGC GCGTCCCCCG GCCCGGCCCG AGGAGGTGCT GCGGTACGCG 
GACGTACTCG GCCTCGACGA GCAGGGACGG GAGCACTGGA TCGCCTTCTA TCAGTGGCTG 
CTGAACCCCA TCTCGGACTA CATCCGGGCC GACCTGCCGT ACGCGGTCGA CCTCGTGGAC 
TTCGCCCGGG CCTGGCGGCC CGACCTGGTG ATCTGGGACG CGACGATGGC GGCGGCGTCG 
ATGGCAGCCC GGGTCAGCGG CGCGGCGCAC GCCCGATTCA CCCTCAACCT GGACTATCCG 
GGCTGGTGCT TCGACCGGCT GCGGGAGCGT CGGGCCGAAC TGCGTGCGGC GGGTCTGTCC 
GAGAACCCGG TGGCCGACCT GCTCCAGCCA TTGGCCGACA AGTACGGCAT CGAGGTCGAC 
GACGAGATCC TGTACGGGCA GTGGACCATC GACCCGATGC CGACCGGGAT GAGCCTGCCG 
ACCAGCGCCA CGGTCCTACC GGTACGGTAC GTGCCGTTCA CCGGGGCGGA CCTGATACCG 
GAGTGGCTGC GCGGCGCACC ACAGCGGCCC CGGGTGGCGT TGACGCTGGG CGAGTCGACG 
CGTCGGTTCA TCAAGGGCGA CTGGGGCCGC ACCCCGAAGA TCCTGGAAGC GGTGGCGGAC 
CTCGATATCG AGGTGGTCGC CACGCTCAAC GCCCAGCAAC TGGAGGGTGT CGAGCAGGTC 
CCCGACAATG TGCGGGCGCT CGAGTGGGTG TCGCTGACCC AGCTCATGCC CACCTGCTCG 
GCGGTCATCC ACCACGGCGG CGGCGGGACA TTCGCCGCAC CGGTGGCCTT CAACCTGCCG 
CAGATCGTCT GCGACACCGA CGAGTCGTTG ATGATGCAGC CGGTCGAGGT CGACCCGCGG 
ACGATGGCCG ACGGCACCTA CCGGGTCGGA TTCGAGTTCG GCGTCAGCGA GGAGGTGGTC 
CAGACGGTGA CCACCTGGCA ACTGCCGGGG AAGAAGTTGG AGGCGACGCC GACGGCGGAC 
TACGTGGTAC GCCGGGGTGC CGGCGTCCGC CTCGACCACT ACGAGAAGTC GGTCGAGGAG 
GTCCGGACAA TGATCCAAGA CGTGGTGCGT GAGCCGTCGT ACCGCGACGG TGCCCGGGCG 
ATTTTCGACA CCTGGCTGGC CATGCCGAGC CCCGCTGACA TCGTCCCGCT ACTGGAACGA 
CTCGCGGGGG AGCACCGTCG TTAG

Protein sequence

MRIVIAVQPS HAHLWPITPV AWALQSAGHE VRVATHARFA DSVRAAGLTP VGLGDPAADE 
ARTRSDARPP ARPEEVLRYA DVLGLDEQGR EHWIAFYQWL LNPISDYIRA DLPYAVDLVD 
FARAWRPDLV IWDATMAAAS MAARVSGAAH ARFTLNLDYP GWCFDRLRER RAELRAAGLS 
ENPVADLLQP LADKYGIEVD DEILYGQWTI DPMPTGMSLP TSATVLPVRY VPFTGADLIP 
EWLRGAPQRP RVALTLGEST RRFIKGDWGR TPKILEAVAD LDIEVVATLN AQQLEGVEQV 
PDNVRALEWV SLTQLMPTCS AVIHHGGGGT FAAPVAFNLP QIVCDTDESL MMQPVEVDPR 
TMADGTYRVG FEFGVSEEVV QTVTTWQLPG KKLEATPTAD YVVRRGAGVR LDHYEKSVEE 
VRTMIQDVVR EPSYRDGARA IFDTWLAMPS PADIVPLLER LAGEHRR