Gene Meso_1895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_1895
Symbol
ID	4182865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	-
Start bp	2031643
End bp	2032812
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	63%
IMG OID	638067789
Product	HK97 family phage major capsid protein
Protein accession	YP_674453
Protein GI	110634245
COG category	[R] General function prediction only
COG ID	[COG4653] Predicted phage phi-C31 gp36 major capsid-like protein
TIGRFAM ID	[TIGR01554] phage major capsid protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAGC ATATGAAAAT CGAAACGCGT TCCGAACCGC TCGAAATCCG CAGCGATGAG 
AACACCGACC CCGTTGCAGC CGCGACGGCG GCGGTCGAGG AACTTCGCTC CGCGTCGGAA 
CAATTCCGCA CGTCGCAGGC CGAAGCCCTT CGCGCTGCAA ACGACCGCAT TGCCGCGCTC 
GAAACCCGCC TTTCCCGTCC GAACGTCCAG ACCGAACAGC GCAACGAGCC AAGCATCGAA 
CAGCGCGCCT TCAACAATTT CCTGCGCTTC GGCAATACCA ATCTCAGCGC CGACGAACAG 
CGCGCCCTCA CGGTCTCGAC CGACGCGGCA GGCGGCTTCC TTGTGCCCGA TAATTTCGTT 
GCCGAGATGC TGCGCAATGT CGTCCAGTTC TCGCCCGTGC GTCAGTATGC GCGCGTGATG 
AACGTGGCCG GCGCGAACGT CCGCATGCCG AAGCGCACCG GGACCATGAC CGCCGCGTGG 
GTTGCTGAGA CCGGTGACCG CGCCAGCACC CAACCGGCCT ATGGCGAGGT GGAACTGACC 
CCGTTTGAAG CGGCATGCTA CGTCGATATC AGCAATCAGT TGCTGGAAGA CAGCGCGTTC 
AACCTCGAAA GCGAACTCGC ATTCGACGCG GCGGAAGAGT TCGGCCGGCT GGAAAGCGTT 
GCATTCGTCG CCGGAGACGG CACGGGCAAG CCGAAGGGCA TCCTCGCGGA TACGGGCATC 
GCAACCGTAG TGTCAGGCAA CGCCTCGACG CTGGGCACCG CACCAGCCGA CAAGCTGATT 
GACTTGCTCT ACAAGCTCGC ACCGGCCTAT CGCCGCAATG CAACGTGGGC GCTCAATTCC 
ACGACGCTGG CATTGGTGCG CAAGCTGAAG GACAGCCAGG GTAATTTCTT GTGGCAACCG 
GGCATCGCCA ACGGACAGCC AGAGACGATC CTTGGCCGTC CCGTCGCCGA GATGCCTGAC 
ATGCCGGACG TGACGGCGGA CGCCCTGCCA ATCCTGATCG GTGATTTCCA GCAGGGATAC 
CGGATCGTGG ACCGGGTTTC GCTCGCCGTC CTGCGCGACC CCTACACCAT GGCGTCCAAG 
GGTCAGACCC GGTTCCACAT GCGCCGTCGC GTCGGCGGCG GTGTAGTGAA GGCCGAAGCC 
TTCAAGGCGC TGAAAATCGC CGCCTCCTAA

Protein sequence

MTKHMKIETR SEPLEIRSDE NTDPVAAATA AVEELRSASE QFRTSQAEAL RAANDRIAAL 
ETRLSRPNVQ TEQRNEPSIE QRAFNNFLRF GNTNLSADEQ RALTVSTDAA GGFLVPDNFV 
AEMLRNVVQF SPVRQYARVM NVAGANVRMP KRTGTMTAAW VAETGDRAST QPAYGEVELT 
PFEAACYVDI SNQLLEDSAF NLESELAFDA AEEFGRLESV AFVAGDGTGK PKGILADTGI 
ATVVSGNAST LGTAPADKLI DLLYKLAPAY RRNATWALNS TTLALVRKLK DSQGNFLWQP 
GIANGQPETI LGRPVAEMPD MPDVTADALP ILIGDFQQGY RIVDRVSLAV LRDPYTMASK 
GQTRFHMRRR VGGGVVKAEA FKALKIAAS