Gene Hore_12850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_12850
Symbol
ID	7313606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1379789
End bp	1380850
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	38%
IMG OID	643611725
Product	Stage II sporulation P family protein
Protein accession	YP_002509030
Protein GI	220932122
COG category
COG ID
TIGRFAM ID	[TIGR02867] stage II sporulation protein P

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00000279159
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATTA ATAAAGCCAA ATATGTGGTA ATTATAATTA TTCTGGTCCT GGCATGGTTA 
AATATCATGA AATACCGGAC TACTGGTAAT GAAGCAATAC CGGTCTGGTC GAGTTTTGAT 
AAAAAATACT ATAGACAGGT TAATATGGGA ACCCTGGATA AAATTAAAAA AACCCTGCAA 
CCCGATAATT TAATATATCA GCTAACCGGG ATCCGCATTA AGGCCCCTAT TACCTACCTG 
AAACGGGAAA TACCTTTATT AAGTTATTAC ACCCCTGCCA CGTTGAGACA ACCTTCCAGG 
AAGGTTTATG AACCTGCAGA AGATAAAAGT AAAAAAAGTA GTGTTATCAG GTTAAAATTT 
GATTTGCGTG AAAGTAAACA AAGGGAAGCA GATAATATTA AAAAAGCGGT AGAACGTCCT 
CTGGTTGTGA TATACCATAC CCATACTTCA GAAACCTATA TAGATGATCC CCGACCCCAG 
GATAACAACG GACATGTTCT GCCGGGTCAA ATCGGGAATA TAGGGAGGGT TGGAGCCGAG 
CTTGCCCGGA TCCTTTCAGA ACAACATAAT ATAAGGGTTA TACATACAAC CAGGGTACAT 
GATGAAAGTT ATGCCCGGGC CTATTATAAA TCACGACAAA CCCTTAAAAA TATTTTAAAA 
AAGTACGAAG GAGTTGACCT GGTACTTGAT ATTCACCGGG ATGGAGTTGA AGATATTAAA 
GAAGGGGTAT ATACTACCAC CCTTAATGGA AAAAAAGTTG CCAGAATAAT GATAGTGGTG 
ACAAACGGTA AATTTGATTT TGCCAGATTG AATCTTAAAG AGCATCATCA GAACTGGAAG 
AAAAACCTTG AGTTTGCTCA AAAAATGTCA GGCAAAATTG AGGAAATGTA TCCTGGGCTC 
CTCAAAAGAC TGGAGATTAG AGATACCACC TATAATCAGG ACCTTCATCC CAGGGCTCTA 
TTACTGGAAA TAGGTGATTA CAATAATACA ACCACAGAGG CCATAAATTC GGTAAGGTTA 
CTGGCTGATG TAATTTCTTC TTTACTGTAT AAAAGGGATT GA

Protein sequence

MSINKAKYVV IIIILVLAWL NIMKYRTTGN EAIPVWSSFD KKYYRQVNMG TLDKIKKTLQ 
PDNLIYQLTG IRIKAPITYL KREIPLLSYY TPATLRQPSR KVYEPAEDKS KKSSVIRLKF 
DLRESKQREA DNIKKAVERP LVVIYHTHTS ETYIDDPRPQ DNNGHVLPGQ IGNIGRVGAE 
LARILSEQHN IRVIHTTRVH DESYARAYYK SRQTLKNILK KYEGVDLVLD IHRDGVEDIK 
EGVYTTTLNG KKVARIMIVV TNGKFDFARL NLKEHHQNWK KNLEFAQKMS GKIEEMYPGL 
LKRLEIRDTT YNQDLHPRAL LLEIGDYNNT TTEAINSVRL LADVISSLLY KRD