Gene Hlac_3379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3379
Symbol
ID	7402231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	131107
End bp	132456
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	58%
IMG OID	643709927
Product	putative PAS/PAC sensor protein
Protein accession	YP_002567493
Protein GI	222481257
COG category	[R] General function prediction only
COG ID	[COG3413] Predicted DNA binding protein
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCAT CGGGTTCTTT GGGGGATGTC TATGCCGAAA CGCTGGCCGT CTTCGACCGG 
CGCGACGACC CCTCTGAGCC ACTCACAACT CCAGAGGTGG CAAACTCGCT CGACGCGGCT 
CGACGTACCG TCTACAAACG TCTAGAGAAG CTGGCGAGCA GTGGTGAGTT GAAAACCAAG 
AAGGTAGGTG CCAACGCCCG GGTCTGGTGG CGATCGCATC CGGATGAAGG ATCGTCCGTA 
AACGCGACCA ATACCCACGC GACGCCGACG CTGAGCAACG CCGAGCGCAC GGTCATCGAG 
AAAATCCTTG AAGCCAGTCC GATCAGCATC GTGGTGGTCG AGCCGTCCGG GCAGATCTCC 
CTCGCGAACG AACGGGCTGA AGAAATGCTT GAACTGGAGC GTGACGAGAT TACCTCTCGA 
ACCTACCGCC AACCGGAGTG GAAGATCTAT TACGACGACG GCACGCCTGT CAGCGAGGAC 
GAGCACCCCG TGACTCGCGT CCTGGAGACA AAAGAACCCG ATTACGGCTT CGAACACTGG 
ATCGACCTCC CGAACGGAAC CGAACGCTGG CTGTCGAGCA ATTCGGCACC TGTATTGAGT 
GAAGATGAAG AAGTTGAATA TGTTGTCGTG GGATTCGAAG ATACAACCCG GTTGAAAGAG 
CGCGAGGACA AGCTGACGAG CGATAAACGC CGGGTGCTCG AACTCTATTC CAAGCAGTTA 
TTCAGCCCGC TGCTCGACGT AGTTGACGGT GACATGCGCA TCGACGTTGA CGAAGTCGTT 
CGCCTCCAAG ACGGGTCGGT CCTCCAGTAC ATCACCGGGA GGGGCATTTC GGCAAAAGAG 
TTGATCGACG TGTTCGACCA GGCGTACGGT GTTGACGATA CCCGGCTGCT TCAGTCGAGC 
GCCGATAAGT GCCGGGTTGA GGTCCACGTC GAGGCGCCGA CCGTGTCGCT AGTCTTTGCA 
GAGTTGGGGG GACAGGTGAA ATCCTTGTTT CAGACCAACG GTGACGCAGG CCCTCTCCTC 
ACGGCTGAAG TGCCAGGAGA TGTGGAAGCG AGGACGGCCG TACAGGCCGT CCGGAAGGTG 
TATCCAGATA TCCGATTAGA GTCACAGGAA CTCCAGTACT CGCCGCGGCT CCTCTACGAC 
ATCGTCGAAG ACGTGCTTAC CGAACGGCAG TTCACGTCAT TGCAGACGGC ATATTATGGC 
GGGTATTTCG AGACGCCCCG GAAGAGCATC GGTGACGAAC TCGCCGAGCG GCTGGGGATC 
ACCCGTCAAA CCTTCAATCG ACACCTTCGA CTGGCCGAGA ATACCGTCTT AGAGCAGTTG 
TTCGAGGGGT CGGGAAAGGC CGTACGCTGA

Protein sequence

MSSSGSLGDV YAETLAVFDR RDDPSEPLTT PEVANSLDAA RRTVYKRLEK LASSGELKTK 
KVGANARVWW RSHPDEGSSV NATNTHATPT LSNAERTVIE KILEASPISI VVVEPSGQIS 
LANERAEEML ELERDEITSR TYRQPEWKIY YDDGTPVSED EHPVTRVLET KEPDYGFEHW 
IDLPNGTERW LSSNSAPVLS EDEEVEYVVV GFEDTTRLKE REDKLTSDKR RVLELYSKQL 
FSPLLDVVDG DMRIDVDEVV RLQDGSVLQY ITGRGISAKE LIDVFDQAYG VDDTRLLQSS 
ADKCRVEVHV EAPTVSLVFA ELGGQVKSLF QTNGDAGPLL TAEVPGDVEA RTAVQAVRKV 
YPDIRLESQE LQYSPRLLYD IVEDVLTERQ FTSLQTAYYG GYFETPRKSI GDELAERLGI 
TRQTFNRHLR LAENTVLEQL FEGSGKAVR