Gene Csal_1397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1397
Symbol
ID	4029061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1584712
End bp	1585731
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	637966582
Product	phage major capsid protein, P2
Protein accession	YP_573451
Protein GI	92113523
COG category
COG ID
TIGRFAM ID	[TIGR01551] phage major capsid protein, P2 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAACG ATACCCGCAT CCTCTTCAAC CAGTTCGCCG ACCAGGTGGC CAAGCTCAAC 
GGTGTGCCCG ACGCGACCCA GAAATTCGCC GTCGATCCCA CCATTCAGCA GCGCCTCGAA 
AAACGCATTC AGGAGTCCAG TGACTTCCTG AACCGCATCA ACATGATCGG CGTCGACGAG 
CTCAAGGGCG AAAAGCTCGC CCTGGGCGTC TCGGGCCCGA TCGCCGGGCG TACCAACGTC 
AGCAATCAAG ATCGCCAGAC CCGCGATCTC TCTACGCTCG ACCCGCAGGG CTACGAGTGC 
CGCATGACCG AGTTCGACAC CCATCTCGGT TACAACAAGA TCGACGCCTG GGCAAAGTTC 
CCCAACTTTC AGGCGCTGAT TCGTGATGCC GTCATTCGTC AGCAGGCGCT CGACCGCATG 
ACCATCGGAT TCAACGGCAC GAGTGCCGCC ACGCAGACTG ACCGCGCCGC GAACCCGATG 
CTCGAAGACG TCAACATCGG CTGGTTGCAG CAGTACCGCA ACAACGCCCC GGCCCGCGTC 
ATGACGGGCG GCGCCACCGC CGATACCGTC CAGGTCGGCA AGGGCGGCGA TTACGTTAAC 
CTCGACGCCC TGGTCTACGA CGCCGTCAAT AGCCTGCTCG AACCCTGGTA CCGCCGCGTG 
CCGGGCCTGG TGGTGATCGT CGGCCGCGAC CTGCTCAGCG ACAAGTACTT CCCGCTGCTC 
AATACCGAAC AGCCGCCCAC CGAACAGATG GCTGCCGACC TGGTCATCAG CCAGAAGCGC 
ATCGGCGGCC TGCAGGGCAT GGACGTGCCG TTCTTCCCCG ACAACGCGCT GATGGTCACC 
ACGCTGGATA ACCTCTCGAT CTACTGGCAG ACCGGCGCGC GCCGCCGCTA CGTCACCGAG 
AATCCCAAGC GCAACCGCAT CGAGAACTAC GAGAGCTCGA ACGACGCCTA TGTCATCGAG 
GACTTCGGTG CCGGCTGCTT GATCGAGAAC ATCGAGCTCG GCGACTTCAC GGCCGCGTAA

Protein sequence

MRNDTRILFN QFADQVAKLN GVPDATQKFA VDPTIQQRLE KRIQESSDFL NRINMIGVDE 
LKGEKLALGV SGPIAGRTNV SNQDRQTRDL STLDPQGYEC RMTEFDTHLG YNKIDAWAKF 
PNFQALIRDA VIRQQALDRM TIGFNGTSAA TQTDRAANPM LEDVNIGWLQ QYRNNAPARV 
MTGGATADTV QVGKGGDYVN LDALVYDAVN SLLEPWYRRV PGLVVIVGRD LLSDKYFPLL 
NTEQPPTEQM AADLVISQKR IGGLQGMDVP FFPDNALMVT TLDNLSIYWQ TGARRRYVTE 
NPKRNRIENY ESSNDAYVIE DFGAGCLIEN IELGDFTAA