Gene Hlac_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3663
Symbol
ID	7402454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	+
Start bp	423537
End bp	425117
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	54%
IMG OID	643710194
Product	hypothetical protein
Protein accession	YP_002567760
Protein GI	222481524
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGATG TCCACTTCGA GGTGTACGAC ACCGAAGCTG GGTGGTGGTG GCGACTGCGA 
ACCGGCAGTC TCGTTTTGAG CCAGTCGCAA ACAACATTTG ATTCGCCCGA TCAGGCTCGT 
GCAGCCGTCG ACCGCGTCCG TACAGCGGCA TCAGTCGTCA AAAATATCCC GGAGCGACAG 
TTCGAGGGTA CCCAAGCGAG CGATCGCGTT ACTGACGCGC AGTGTGTTAC TGTCAATGTT 
ACCGGGCAGT ACGAGTGGGT TCTTGAAGAC GACGGTGAAG TGCTTACGCA ATCGACAACA 
GCATACGAAA CCGAGGCCGG TGCTCTAGCG GCTGCCAAGG CATTCTGTAC ACACGCCAGC 
GCCACAGTAA CGGTGTTCCT CTTTAGGAAC CAGGAACAGC AGTCGTCATT TGATGTCGGC 
TCAACATCTA TACTGGCGGC GCTTCGCTCG TTAGCGACGC TCCCATACCG AGGGGTCAAA 
CACAATCAAA AAATCAAGGA GATTGACACT CGGATCGTTG TTTCTGGCAT CCGTGGAAAA 
TCATCGACCA CTCGCCGACT TAACGACGTG TTCAGGCGTC GCGGGTACGA TACACTGACA 
AAAATCACGG GGAATCAGCC ACATCTGATT CACAATAATG GAGTGATCCC GCTGAACCGC 
CAAGGACCCA GAACGACCTT GTACGAAAAT ATTGGCGTCT TACGAGAGTA CGTCCCCAAG 
CTTGCAGAAT ACGCTCCTGA CGATGTCGCA ATTTTCGAGA ATCAAGGTAT CACGGAGTAC 
ACCACGCGCC TGATTAACGA ATCATTCATA CACCCACATA TAATTGTCCT GACCAACATC 
CGGCGTGATC ACCAAGACAC GCTCGGCGAG ACTCGGGCTG AGATCGCACG GTCGTTCGCC 
AAATCAGTCC CTTCTAGTGC CCATGTCGTG TGTGGTGAGC AAAATCCAGT CATCTACCAG 
TATCTGGAGC GTGAGGTCAC GGCCACCGGG GCGACGATCG AACAAGTAAC AATTCCTGAG 
AAACACAAAG GGTTGCTTGG AGCGGAGACG GTTCACGCAG TGAACCCCAC ACTTATAGCC 
GTCGATGAAC CCCCCCTTCC TGCGGATGAG ATCCAAACGT ATCTCACACA GATCCAGCCG 
AAGTGGACTG CCATCCCGAA CGGGCTCGTA TTCAACGCCG CTGAGGTGAA CGACGTCGAG 
AGTACAGAAG CGGTCAGACA GGCCCTTGAG AAATCTGACC GCATCACTCC GTTTGTTTTC 
TTGCGTCCGG ATCGGCGCGG GCGAACCGCC TCGTTCGTTT CGTACTTCGA TCACCTCGCC 
AATCGTGGTG TTATCGACGT TGGATACGTG ATGGGTAGTG ACAGCTCAGT ATTCGCGAAT 
GAAACGACGT GTGAAGTCAA GGAGATCGAC TCCGGCGCCG ATCCGGCAGC CGTGTTGGAT 
CGGCTGCTCA ATCATGATCG ACCGGTGATG ATTATGGGAA ACACCGTCGA CGAGTTTATG 
CGAGAGCTTG ATGGTAAAAT CGACTCGCGA GCACAGCGCA TGTCTCTAGC AGATAAGCCA 
CGAGGGCCCC CAGCCACGTA G

Protein sequence

MEDVHFEVYD TEAGWWWRLR TGSLVLSQSQ TTFDSPDQAR AAVDRVRTAA SVVKNIPERQ 
FEGTQASDRV TDAQCVTVNV TGQYEWVLED DGEVLTQSTT AYETEAGALA AAKAFCTHAS 
ATVTVFLFRN QEQQSSFDVG STSILAALRS LATLPYRGVK HNQKIKEIDT RIVVSGIRGK 
SSTTRRLNDV FRRRGYDTLT KITGNQPHLI HNNGVIPLNR QGPRTTLYEN IGVLREYVPK 
LAEYAPDDVA IFENQGITEY TTRLINESFI HPHIIVLTNI RRDHQDTLGE TRAEIARSFA 
KSVPSSAHVV CGEQNPVIYQ YLEREVTATG ATIEQVTIPE KHKGLLGAET VHAVNPTLIA 
VDEPPLPADE IQTYLTQIQP KWTAIPNGLV FNAAEVNDVE STEAVRQALE KSDRITPFVF 
LRPDRRGRTA SFVSYFDHLA NRGVIDVGYV MGSDSSVFAN ETTCEVKEID SGADPAAVLD 
RLLNHDRPVM IMGNTVDEFM RELDGKIDSR AQRMSLADKP RGPPAT