Gene AnaeK_3494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_3494
Symbol
ID	6786911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	3953792
End bp	3955363
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	74%
IMG OID	642764965
Product	transglutaminase domain protein
Protein accession	YP_002135836
Protein GI	197123885
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.764922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTCC CCCACCCGCA CAGGCTCGGC CTCACCGTCC TCGCGCTCGT CCTCGGCACC 
GCCGGCCTGA TGGCGTACAA GGTGCGCGCG CTCGGCTACC GGCTCGCGGA CATCCTGCCG 
GTGCGCCAGT ACGAGGTCAC CTACGCGCTC GAGCTCGACG GCCACGGCGG CGACGTGCGC 
GTCCGCAGCT TCCTGCCGTC GAGCGACGCG CACCAGACCA TCTCCGAGGA GCGCGACCAG 
ACCTCCGGCC TGCACCTCTC GCAGTCGATG GATGGGCCGA ACCGGGTGGC CACCTGGAGC 
GGCGCCGACG TGCCCAACGG CGCGCGCATC CGCCACGCGT TCAAGGTGCT CCCGCGCCGC 
GTGTCCTACG ACCTGCCCGC CGGGCTCGAG GTGCCCGCCG CCTACCCACC CTCGGCGGCC 
GCCTGGCTCC GGCCGGAGAA GGACATCCAG GTGGACGCGC CGGAGATCCG CGCCACGCTG 
CAGCGCATCG GCGCCGATCA GGGCGGCGTG GTGGAGCGGC TCCGGCGCAT CCACGCGCTG 
GCCGCCTCGC TGCAGCCGCG GCCGTTCAAG GGGACCACCG ACGCGCTCAC CGCGCTGCGC 
CTGGGCGAGT CGAGCTGCAA CGGCAAGAGC CGGCTGTTCG TGGCGCTGGC CCGCGCGGGC 
GGGATCCCGG CGCGGCTGGT GGGTGGCCTC ATCCTCGAGC CCGGCGCGAA GCGGACCTCG 
CACCAGTGGG TGGAGGCCTG GGTGGCCGGG CACTGGGTGC CGTTCTGCCC GACGAACGGC 
CACTTCGCCG AGCTGCCCGA GCGCTACCTC ACGCTCTACG TCGGCGACGA GGCGCTGTTC 
CGCCACACCG CCGACGTGAA CTTCGACTAC CGCTTCGAGA CGCACGGCGC GCTGGTGCCG 
TCGCCGCAGG CGAAGGCGAC GTTCACGCTG TTCGACGTGT GGGGGCTGTT CGACCGCCTG 
CGGCTCCCGT TCGCGCTGCT CCGCACCGTG CTGATGCTGC CGGTGGGCGC GCTGCTGGTG 
GTGCTGTTCC GGAACGTGGT GGGGATGCCG ACGTTCGGCA CCTTCCTGCC GGCGCTGCTC 
GCCGCCTCGG CGGGCGAGAC CGGCGCCGGG TACGGCGTGC TGGCGGTGCT GCTGGTGGTG 
GCGGCGGTCG CGGCGGTGCG CTGGGGGCTC ACCCGGCTCG AGCTGCTCCA CTCGCCCACG 
CTCGCGATCC TGCTGGCGGC GGTGGTGCTG ACGCTGCTCA CCACCTCGAT GATCGCGGAG 
CGCGCCGGCA TCGCGCAGCT CACCCGCGTC ACCATGTTCC CGATCGCCGT GCTCGCCATC 
TGCGCCGAGC GCTTCTACCT GTCGCTCACC GAGCACGGGG CGCGCGCCGC CGGCAAGGAG 
CTGGCCGGGA CGCTGGTGGT GATGCTGGCG TGCCACGCGG TGATGAGCTC GCTGGCGCTG 
CAGGTGCTGG TGATCGGCTT CCCCGAGGTG CTGCTGCTGG TGGTGGCGGC GAACGTGTAC 
CTGGGGCGCT GGGTGGGGAT GCGGCTCAGC GAGTACCGCC GCTTCCGCGG GCTGCTCGGG 
GGCGCGGCGT GA

Protein sequence

MALPHPHRLG LTVLALVLGT AGLMAYKVRA LGYRLADILP VRQYEVTYAL ELDGHGGDVR 
VRSFLPSSDA HQTISEERDQ TSGLHLSQSM DGPNRVATWS GADVPNGARI RHAFKVLPRR 
VSYDLPAGLE VPAAYPPSAA AWLRPEKDIQ VDAPEIRATL QRIGADQGGV VERLRRIHAL 
AASLQPRPFK GTTDALTALR LGESSCNGKS RLFVALARAG GIPARLVGGL ILEPGAKRTS 
HQWVEAWVAG HWVPFCPTNG HFAELPERYL TLYVGDEALF RHTADVNFDY RFETHGALVP 
SPQAKATFTL FDVWGLFDRL RLPFALLRTV LMLPVGALLV VLFRNVVGMP TFGTFLPALL 
AASAGETGAG YGVLAVLLVV AAVAAVRWGL TRLELLHSPT LAILLAAVVL TLLTTSMIAE 
RAGIAQLTRV TMFPIAVLAI CAERFYLSLT EHGARAAGKE LAGTLVVMLA CHAVMSSLAL 
QVLVIGFPEV LLLVVAANVY LGRWVGMRLS EYRRFRGLLG GAA