Gene Xaut_3708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_3708
Symbol
ID	5424197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	+
Start bp	4113428
End bp	4114543
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	67%
IMG OID	640882964
Product	HK97 family phage prohead protease
Protein accession	YP_001418591
Protein GI	154247633
COG category	[R] General function prediction only
COG ID	[COG3740] Phage head maturation protease
TIGRFAM ID	[TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGACC CCCGGACGCT CTATGTCAGC CGGCCCCTGC TGAACGGCGC GGAACTGATC 
GATTGGGCGA AGGGGCAGGG GTTTACCAAG ACGGTCCCCG CCGACGATCT GCATGTGACC 
ATCGCCTACA GCCGCGATCC CGTGGACTGG GCGGCAGCCG GTGACCACTT CGACCAGGTG 
CGGGCCCGGG CTGACGGGCC GCGTTCAGTG GAGCAACTCG GCGACAAGGG CGCGGTCGTG 
CTGCGGTTCG AGCATGCTGA ACTCGCCCAG CGCTGGCAGG CCTTCCGCGA CATTGGGGCG 
TCCTGGGACC ACGACGGGTA CCGCCCGCAC GTGACGATCA CCTACGACGC GGCGGGTGTC 
GACCTGAGCA AGGTCCAGCC GTTCAGCGGC GAGCTGGTCT TCGGACCCGA AGAGTTCGCG 
GAGATCGATG AGGATCGGGC CGACCGGGTC CGGGCGAGTG AGAAGGGGCG GCGCGCCATG 
GAGATCAAGA GCTTCGCTCT GGAACTGAAG GAGGTTGGCG ACGCCGGCAC CTTCACCGGC 
TACGGGGCAG CGTTCGGCAA CGTCGACCAG GGGCGAGACC TCATCGCGCG CGGAGCCTTC 
GCGGATAGCC TGTCGGCGTG GCGTTCGAAG GGCAAGTTGC CCAAGCTCCT GTGGCAGCAC 
GACGCGCGCA AGCCGATCGG CGTGTGGACC GAGATGCGCG AGGACGACTA CGGGCTCTTC 
GTGAAGGGCC GGTTCACCGC CGGCGTGAAG CAGGCGGATG AGGCGTACGC GCTGCTCAAG 
GATGGTGCTC TGGATGGCCT TTCCATCGGC TACGCCACCA TCGAGGACGA GATCGACCGG 
GCCGCAGGGA TCCGGAAGCT GGTCAAGCTC GACCTGATGG AGGTCAGCCT GGTCACCTTC 
GCGATGAACC CGGCCGCCGG CGTCACCGGC GTGAAGGCGG GCCCGCCGCG CACCATTCGA 
GAATTCGAGG CCGGGCTTCG GGAGAAGTTC GGTTTCTCGC ACGCCCAGGC GAAGTCGATC 
GCTTCGTCCG GGTTCAAGTC GCTGGAGCCT CGGGATGAGG ACGGCGCGAT GAACGACCTG 
CTGCGGACCA TCAAGGGCAT CCGGGCCGGT CTCTGA

Protein sequence

MGDPRTLYVS RPLLNGAELI DWAKGQGFTK TVPADDLHVT IAYSRDPVDW AAAGDHFDQV 
RARADGPRSV EQLGDKGAVV LRFEHAELAQ RWQAFRDIGA SWDHDGYRPH VTITYDAAGV 
DLSKVQPFSG ELVFGPEEFA EIDEDRADRV RASEKGRRAM EIKSFALELK EVGDAGTFTG 
YGAAFGNVDQ GRDLIARGAF ADSLSAWRSK GKLPKLLWQH DARKPIGVWT EMREDDYGLF 
VKGRFTAGVK QADEAYALLK DGALDGLSIG YATIEDEIDR AAGIRKLVKL DLMEVSLVTF 
AMNPAAGVTG VKAGPPRTIR EFEAGLREKF GFSHAQAKSI ASSGFKSLEP RDEDGAMNDL 
LRTIKGIRAG L