Gene HY04AAS1_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_1490
Symbol
ID	6744320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	-
Start bp	1407051
End bp	1408964
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	31%
IMG OID	642751311
Product	transglutaminase domain protein
Protein accession	YP_002122152
Protein GI	195953862
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAAA GTTTAAAAGT TTACAGCTTT CTTTTAATAC TGGTATATTT AAGCATAGCA 
TTCTCAATAC TATCTATAAG TTTAGTTAGT TTTAGCCCTA TATTTTTTAT AGGTATTGCT 
TTGGTTGTTA TAGGCATTTT TCAGGATTTT AAAAACAAAT ATTTACCAAG AATCGTTGTA 
AATACAATTG CAGTTTCATC TGTGATTTTG GTTTTTGCAG TAAGCTTCAA CATAACTGCA 
CTTTTTGATT TTGCTAAAAA CATAATAATA ACGTTCTTAG GCATCAAATC CTTAGAGAAA 
AAGCAACCAA GAGACATATA CCAAATACTT ATATTGGAAA CCATGGGTAT GGGTATAGTA 
GGGGTTGCCA CCACAGATAT AAAGTTTTTA GCGATGCTAA TAATTTGGGT TTTCTTGAGC 
ATTTTTATAT TCTTAACCAC AAATATTTTT AAAAGCCTAA AAGACGAAAT CTTAACAAAA 
TATCATATAA AACTTATCAG CTACGCTGTA GGGTTTATAT CTATAAGCAC CGTAGTTATA 
GGATTTTTCA TATTTCTTGC TATGCCAAGG ATACAATCGC CTCTTTTAAA CATAGGAATA 
GGGGGTATTT CAAATACAGT AGGATTTTCT AATACACTTT CTCCATCAAA CGCCACCAAT 
GTACTAGAAA ACACCTCCAC AGTTTTCAGA ATATTTAACA TAAAAGGAGA TATAAATTTA 
AAGGATGCTT ACTTCATAGG AGAAACCTTA GATTATTTCA ACGGCATAAG TTGGACTCAC 
AAACATAGAG CAAAGGGACC AAAGATTCTA AAAGGTAACC TTGTATCTTG CGATATCATG 
ATAGAGCCAA GCTACGACAA TATTCTTTTT GGTATCTTGT TTCCATACAT GGTTAAAATC 
TATAAAAACC CTATAAAAGT TTATATAACA AGCGATAATA CGATAAGAAC AAATAAACCC 
ATCACAAATA GAACTGTTTA TAGGGTGTGG TCTTACGTAA CAGATTCCTA TAGACAAAAC 
CTTGTAAATA TGAACAGATT TTTACAACTG CCTCAAAACA TAGACCCATC AATAGTAAAA 
CTTGCACAAT TCCTAAAAGC CCAAAACAAA AATCCCATAG AGGCTGTAGA AAACTATTTT 
AAGCAGGAAA ACTTCAAATA TTCTCTAAGT AACAAAGCTT CAAATAACTT TCTATACGAT 
TTTTTATTTA AGTATAAGGC TGGAAACTGT GAAGCCTACG CTTCTTCAAC TGCTCTTTTG 
CTTAGATTGA TGGGTGTACC TTCAAGAGTG ATAGTGGGTT TTCATGGGGC TATTTACAAC 
AAAGATGGGC ACTACTTTTT TGTAACAAAC TCCTCAGCTC ATTCATGGGT AGAAGCATAC 
TACAACGGTA AATGGCAAAC CGTGGATACA ACCCCAACAG ACTACACACA GACAATACCA 
AAATTAAGTA AAGCAAGGAT GTTTCTTGAT TATATAAACT ACCTATGGGA TATAAATGTA 
ATATACTATT CTACCGCAAG GCAAAAGTAT CTACTGGAAA GCACCGCTAA AAATATAAAA 
GCTATAGCTA CTCATTATAC AAAATATTTA GTTTATGCAG TGGTTGTTTT GATGGTTTTT 
TATATGGCTT TTAATAAAAT ATTACTAATG TTTAGCATAG ATGCCATGTA TAAAGATATA 
TGCAAAAGGT TGAAACAGTC TAATATGAAA TATTGCACAC CAGAGAATGC ACCAAGCTTC 
ATAAAAGAAA ACGGTTTTAA AGTCTTTTTT GATATTTATA TAAAAGCTAA GTATTCAAAA 
TACGGCATAG ATAAAAAAGA GAAAAAAATG GCAAAAATAT ATTATAATAA TACTATAAAG 
GCTATAAAAG AGTTTAACAG TTCTATTAAT AGACAACTTA GCAAAGATAC ATAA

Protein sequence

MAKSLKVYSF LLILVYLSIA FSILSISLVS FSPIFFIGIA LVVIGIFQDF KNKYLPRIVV 
NTIAVSSVIL VFAVSFNITA LFDFAKNIII TFLGIKSLEK KQPRDIYQIL ILETMGMGIV 
GVATTDIKFL AMLIIWVFLS IFIFLTTNIF KSLKDEILTK YHIKLISYAV GFISISTVVI 
GFFIFLAMPR IQSPLLNIGI GGISNTVGFS NTLSPSNATN VLENTSTVFR IFNIKGDINL 
KDAYFIGETL DYFNGISWTH KHRAKGPKIL KGNLVSCDIM IEPSYDNILF GILFPYMVKI 
YKNPIKVYIT SDNTIRTNKP ITNRTVYRVW SYVTDSYRQN LVNMNRFLQL PQNIDPSIVK 
LAQFLKAQNK NPIEAVENYF KQENFKYSLS NKASNNFLYD FLFKYKAGNC EAYASSTALL 
LRLMGVPSRV IVGFHGAIYN KDGHYFFVTN SSAHSWVEAY YNGKWQTVDT TPTDYTQTIP 
KLSKARMFLD YINYLWDINV IYYSTARQKY LLESTAKNIK AIATHYTKYL VYAVVVLMVF 
YMAFNKILLM FSIDAMYKDI CKRLKQSNMK YCTPENAPSF IKENGFKVFF DIYIKAKYSK 
YGIDKKEKKM AKIYYNNTIK AIKEFNSSIN RQLSKDT