Gene Pnuc_1343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnuc_1343
Symbol
ID	5052750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polynucleobacter necessarius subsp. asymbioticus QLW-P1DMWA-1
Kingdom	Bacteria
Replicon accession	NC_009379
Strand	+
Start bp	1419212
End bp	1420321
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	45%
IMG OID	640471515
Product	transglutaminase domain-containing protein
Protein accession	YP_001156121
Protein GI	145589524
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTACTA CCCGCCGCTC AGCCCTAAAA ACAATTGCCG GAGCTTTGGC TATTCCTGCG 
CTATCGCCTA TCTCTTCTGT ATTTGCGCAA GCACCTGTCG GATGGACTAC TTACGAAATC 
GTAACCGAAG TGAATTTAGA GTCGCCAAAT GGGGCTGCAG AATCTTGGAT TCCATTACCC 
CTGGTATTGG ACACTAATTA CTTCCAAACA TTAGCCATCA GATCTGAAGC AAGCGATCCT 
AAAGCAGTAA ACCAAATTTA CGAGACGCCA GATAAACAAG CGCGCATGCT TTGGACTAAA 
TGGGATAAAT CTGCAACAAA CCATAGTGTC AAAGTTTCTA TCTTGGTAAG TACATTCAAC 
CGCCATTTAG AAATGGCCCC CCCTAGCCCT GCACTAAAGC TCTCAAGAGA AGATCAGCGT 
TTTTGGACTC GATCTACAAA ATACCTTCCC ACTGATGGCA TTGTGAAAAC TAAATCACAG 
GAAGCGCTTG CTAATACCCC TGCAAATGCT ACTGATGTAG AAAAAGCAAA AGCCATCTAC 
AACTGGGTTG TAGATAACAC TCATCGTGAT CCTAAAACTC GCGGTTGCGG TCAAGGTGAT 
GTGAAGTTGA TGCTGGAAAC CAATAATCTG GGAGGCAAGT GTGCCGATAT CAATGCTGTC 
TTTGTCGCCT TAGCGCGTTC AGCTGGTATT CCAGCCCGTG ATGTCTACGG TATTCGTATT 
GCCGATTCTG CACGTGGCTA TAAGAGCCTT GGTAAATCAG GCGATATCAC CAAAGCACAG 
CACTGCCGCG CAGAGTTCTA TGCAAATGGT TATGGTTGGG TTCCAGTCGA TCCAGCAGAC 
GTTCGTAAAG TGATCTTAGA AGAAACAGGT GGCTTGGCAG TGAACGACCC TAAAGTATTG 
GCGATTCGTG AGTACTTATT TGGCAACTGG GAAATGAATT GGATGGCATA CAACTATGAT 
CACGATATTG CATTGCCAGG ATCCAAGCTA GGCAGCAAAG GTGATATTCC TTTCTTGATG 
TACCCACAAG CAGAAAATAC TGAAGGTCGC TTTGATTCAC TAGACCCAGA TAATTTCAAA 
TACAAAATTA CTAGCCGTCG GATCGGTTAA

Protein sequence

MTTTRRSALK TIAGALAIPA LSPISSVFAQ APVGWTTYEI VTEVNLESPN GAAESWIPLP 
LVLDTNYFQT LAIRSEASDP KAVNQIYETP DKQARMLWTK WDKSATNHSV KVSILVSTFN 
RHLEMAPPSP ALKLSREDQR FWTRSTKYLP TDGIVKTKSQ EALANTPANA TDVEKAKAIY 
NWVVDNTHRD PKTRGCGQGD VKLMLETNNL GGKCADINAV FVALARSAGI PARDVYGIRI 
ADSARGYKSL GKSGDITKAQ HCRAEFYANG YGWVPVDPAD VRKVILEETG GLAVNDPKVL 
AIREYLFGNW EMNWMAYNYD HDIALPGSKL GSKGDIPFLM YPQAENTEGR FDSLDPDNFK 
YKITSRRIG