Gene Sare_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0420
Symbol
ID	5708397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	480619
End bp	481551
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	69%
IMG OID	641269945
Product	ECF subfamily RNA polymerase sigma-24 factor
Protein accession	YP_001535340
Protein GI	159036087
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02952] RNA polymerase sigma-70 factor, TIGR02952 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.512317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00742101
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGACCT TCGGCTACAT GGAACGGCCG GTCGGCCTGA GCGACATACC TTCCCGGTCC 
GCGGTGAACG AACGGTCGAC TCCCGGACCC CGGGAGCAGG GCCAACTCTC CACGTGGGGC 
GAAAGCGGGG TACGCAGCCG TCCACATCAC AATGAGGCGC CCCCCCGACC CTCGATTCCG 
GGCGGAAACG CCAAGCCGGT CGGAACCCGG GTCGCGTCGC CGGCCCGACC GACGATGCCC 
GTGCAGGGCC GCCGGGCGAC CGACCCACCC GCCACCGCCG ACCCCGCCAC CACCGATACG 
GCGGTACTGC CCGCACTGCC GGCCAGCACG CCCGCCACCG GCTTCCCGAG CCGCCCCGAC 
CCGTCCGACC CGGCGACCGA GATCTGGACA TTGGTCGAAC GGGCGCAGGC CGGGGAGGCC 
GAGGCGTTCG GCCTGATCTA CGACCGGTAC GTGGACACCG TCTTCCGGTT CGTCTACTTC 
CGGGTGGGTA ACCGCCAACT GGCCGAGGAC CTCACCTCCG ACACCTTCCT GCGGGCATTG 
AAGCGAATCG GTAGCTTCAC CTGGCAGGGC CGAGACCTCG GGGCCTGGCT GGTGACGATC 
GCCCGCAACC TGGTGGCGGA CCACTTCAAA TCCGGCCGCT ACCGGCTCGA GGTGACCACT 
GGCGACGTAC TCGACGCCGA ACGCGAGGAC CGCGGCCCGG AAGGCAGCCC GGAGGCCGCC 
GTAGTCGAAC ACATCACCAA TGTGACCCTG CTCAGCGCCG TCAAGCAGCT CAACCCGGAG 
CAGCAGGAGT GCATCGTGCT CCGCTTCCTC CAGGGCTTCT CGGTGGCGGA GACCGCCCGG 
GCAATGGGCA AGAACGAGGG TGCGATCAAG GCGTTGCAGT ACCGGGCGGT TCGGGCCCTC 
GCCCGGCTAC TCCCGGACGG CTTCCGGATG TAG

Protein sequence

MTTFGYMERP VGLSDIPSRS AVNERSTPGP REQGQLSTWG ESGVRSRPHH NEAPPRPSIP 
GGNAKPVGTR VASPARPTMP VQGRRATDPP ATADPATTDT AVLPALPAST PATGFPSRPD 
PSDPATEIWT LVERAQAGEA EAFGLIYDRY VDTVFRFVYF RVGNRQLAED LTSDTFLRAL 
KRIGSFTWQG RDLGAWLVTI ARNLVADHFK SGRYRLEVTT GDVLDAERED RGPEGSPEAA 
VVEHITNVTL LSAVKQLNPE QQECIVLRFL QGFSVAETAR AMGKNEGAIK ALQYRAVRAL 
ARLLPDGFRM