Gene Xaut_3155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_3155
Symbol
ID	5425004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	+
Start bp	3502522
End bp	3503808
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	72%
IMG OID	640882401
Product	HK97 family phage major capsid protein
Protein accession	YP_001418042
Protein GI	154247084
COG category	[R] General function prediction only
COG ID	[COG4653] Predicted phage phi-C31 gp36 major capsid-like protein
TIGRFAM ID	[TIGR01554] phage major capsid protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0231727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0147808
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCATC CCGACACCGC CCGCACCATC GCTGGCGCGC CTGAGACCAA GGTGGCCGGC 
GCCGAGGCCA CTTCCGCCGA GGCCAGCTCC GCCGTGGCCG ATTTCCTTGC CGCCTTCGAG 
ACCTACAAGC AGGTGAACGA CACCCGCCTG GCGCAGATGG AGCGGCGCAG CGCCGACGTG 
CTCACCACCG AGCAGCTGGC CCGTATCGAT GCCGCCCTCG ATACCCACAA GGCGCGGCTC 
GACGCCCTCG CCACCAAGGC GCGCCGGCCC GCGCTCGGCG CCGCGCCGGA GCGCACCGAG 
GCGCCCGCCG CCACCCGCGA GCACACCGAT GCCTTCGCCA CCTATGTGCG CCACGGCGAG 
GCCGGCGGCC TGAAGGCGCT GGAGGCGAAG GCCCTGTCCT CCGCGTCCGG CGATGCGGGC 
GGCTACCTCG TGCCCTCGGA GACCGAGACC GAGATCGGCC GGCGCCTTGC GGTGCTCTCG 
CCCATCCGCG CGCTGGCCTC GGTGCGGACC ATCGGCGGCG GCACCTATCG CAAGCCGTTC 
ATGACCTCCG GCCCGGTCTC CGGCTGGGCG GCGGAGACGG CGGCCCGGCC GGAAACCGCG 
AGCCCGGTGC TGGCGGAACT GGCCTTCCCG GCCATGGAGC TCTACGCCAT GCCCGCCGCC 
ACCCAGTCGC TGCTGGACGA CGCGCAGGTG AATGTGGAGG AGTGGCTCGC CACCGAGGTG 
GACACCGCCT TCGCGACCCA GGAGGGGGTG GCCTTCGTCA CCGGCGATGG CGTTGCCAAG 
CCCAAGGGCT TCCTCGCCTA CACCAAGGTG GCCGAGAGCG CCTGGGCCTG GGACAAGGTG 
GGCTATGTGG CCACCGGGGC TGCGGGCGCC TTCCCGTCCG CGACGCCGGC CGATCCGCTG 
CTGGATCTGG TCTATTCGCT GAAGGCCGGC TACCGGCAGA ACGCCACCTT CGTCATGAAC 
CGGCAGACGC AGGGCGCCGT GCGCAAGCTG AAGGACGAGA ACGGCAATTA CCTGTGGGCG 
CCGCCCGCCG GGGTGGGCCA GGCCGCGAGC CTGATGGGCT TCCCGGTGGT GGAGAGCGAG 
GCCATGCCGG ATGTGGCGGC CGACGCCTAT GCCATCGCCT TCGGCGACTT CCGCCGCTTC 
TACCTGGTGG TGGACCGCGC CGGGGTGCGG GTGCTGCGCG ATCCCTATTC GGCCAAGCCC 
TACGTGCTGT TCTACACCAC CAAGCGCGTG GGCGGCGGGG TGCAGGACTT CGACGCCGCC 
AAGCTGCTGA AGTTCGCCGC GAGCTGA

Protein sequence

MSHPDTARTI AGAPETKVAG AEATSAEASS AVADFLAAFE TYKQVNDTRL AQMERRSADV 
LTTEQLARID AALDTHKARL DALATKARRP ALGAAPERTE APAATREHTD AFATYVRHGE 
AGGLKALEAK ALSSASGDAG GYLVPSETET EIGRRLAVLS PIRALASVRT IGGGTYRKPF 
MTSGPVSGWA AETAARPETA SPVLAELAFP AMELYAMPAA TQSLLDDAQV NVEEWLATEV 
DTAFATQEGV AFVTGDGVAK PKGFLAYTKV AESAWAWDKV GYVATGAAGA FPSATPADPL 
LDLVYSLKAG YRQNATFVMN RQTQGAVRKL KDENGNYLWA PPAGVGQAAS LMGFPVVESE 
AMPDVAADAY AIAFGDFRRF YLVVDRAGVR VLRDPYSAKP YVLFYTTKRV GGGVQDFDAA 
KLLKFAAS