Gene Csal_3063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3063
Symbol
ID	4028867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3412417
End bp	3413838
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	65%
IMG OID	637968275
Product	poly(A) polymerase
Protein accession	YP_575106
Protein GI	92115178
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID	[TIGR01942] poly(A) polymerase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAAAG GATTTACCCG CTTTCTCCAA CGCCCCGGTG AACGTTTGAA GACCCTGTTC 
GGCGCCCAAG AGGCCTCCGG CCCTGTCACG CCCAGCCTGC GTGTCATTCC ACGGGATCAG 
CACAACGTGT CTCGCCGTCT GTTCAGCGAG AACGCTCTCA AGGTTCTGTA CCGCCTGCAC 
AACGCCGGAC ACGAAGCCTA TCTGGTCGGC GGCTGCGTGC GCGATTCGCT GCTCGGCAAG 
GTGCCCAAGG ACTTCGACAT CGCCACCGAC GCCACGCCGG AGGAAATTCG CACCCTGTTT 
CGCAACTCGC GCATCATCGG GCGCCGTTTC CGCATCGTGC ATGTGCGCTT CGGTCGCGAA 
ATCATCGAGG TGACGACGTT CCGCGGCCGA CCAGGCGACG ATCACGACGA TACACTGTCC 
CAGCAGTCCG ACGATGGACT GCTGCTGCGC GACAATGTCT GGGGCACCAT CGAAGAAGAC 
GCGCTGCGTC GCGACTTCAC GGTCAACGCG CTGTATTACA ATATCGCCGA CTTCTCGATT 
CACGACTGGG CCAACGGCGT CAGCGACATC GACGAGCGAA CCCTGCGCCT GATCGGCGAC 
CCCGAGGTGC GTTACCGCGA GGACCCCGTG CGCATGCTGC GGGCCGTGCG CTTCGCCGCC 
AAGCTGGACT TCGACATCGA GCCGCGCACC GAGGCCCCGA TCGGCGAACT CGCGCCGCTG 
CTGTTGCAGA TTCCCCCTGC GCGCCTGTTC GAAGAAGTCC TCAAGCTCTT CCTGTCGGGG 
CATGCGCTGC GCACGTTCGA ACTGCTGCGC GAGTACGGGC TGTTCGCCAT GCTCTTCCCC 
GAGACCGACG AGACCCTCGC GGAGTACGAC TGGGCACAGC CATTGATCGA ACAGGCGCTG 
ATCAACACCG ACCGGCGCAT CCAGGAAGAC CGGCCGGTCA CGCCGGCCTT CCTGTACGGT 
GCCATGCTGT GGCCCGGCAT GCGCCTGCGC GCGGAACGTC TCGAGGCGGA GGGCATGCCC 
CCCATTCCCG CCCAGCAGAC CGCATCGCAG CAAAGCATAT CGCGGCAGCT GCAGCATACG 
TCGATTCCCA AGCGCTTCAG CTTGCCGATG CGCGAGATCT GGGACCTGCA ACAGCATCTG 
CCCAAGCGGC GTGGCAAGCG GGCCTTCCAG ACCCTGGAGC ACAAGCGCTT TCGTGCCGCG 
TACGACTTCC TTCTGCTGCG CGAAACCGCT GGCGAGATCG AGCCCGGCCT GGGCGACTGG 
TGGACGGCCT TCCAGGATGG GGACGAGCAC GAGCAGGCGC GCTTGATCGC CAAGACGGGC 
GGCCACCCCG CAGGAACGTC GGACCGCCCC AAGCGCCGAC CGCGCCGCCG CCGGCGTCGC 
AACTCGAATG CCGGGCAGCC TAACGACGGC CGCGATGAGT GA

Protein sequence

MFKGFTRFLQ RPGERLKTLF GAQEASGPVT PSLRVIPRDQ HNVSRRLFSE NALKVLYRLH 
NAGHEAYLVG GCVRDSLLGK VPKDFDIATD ATPEEIRTLF RNSRIIGRRF RIVHVRFGRE 
IIEVTTFRGR PGDDHDDTLS QQSDDGLLLR DNVWGTIEED ALRRDFTVNA LYYNIADFSI 
HDWANGVSDI DERTLRLIGD PEVRYREDPV RMLRAVRFAA KLDFDIEPRT EAPIGELAPL 
LLQIPPARLF EEVLKLFLSG HALRTFELLR EYGLFAMLFP ETDETLAEYD WAQPLIEQAL 
INTDRRIQED RPVTPAFLYG AMLWPGMRLR AERLEAEGMP PIPAQQTASQ QSISRQLQHT 
SIPKRFSLPM REIWDLQQHL PKRRGKRAFQ TLEHKRFRAA YDFLLLRETA GEIEPGLGDW 
WTAFQDGDEH EQARLIAKTG GHPAGTSDRP KRRPRRRRRR NSNAGQPNDG RDE