Gene Csal_1400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1400
Symbol
ID	4029064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1588487
End bp	1589557
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	637966585
Product	Phage portal protein, PBSX
Protein accession	YP_573454
Protein GI	92113526
COG category	[R] General function prediction only
COG ID	[COG5518] Bacteriophage capsid portal protein
TIGRFAM ID	[TIGR01540] phage portal protein, PBSX family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.691586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGG CCGACAAACC CCGCATGCGT GTGCCGGCGA CCCTGTCCGA GTCCGAACCG 
GCGGCGGAGG CGTCGCCAGC CCCGGCGCGG GCCGAGGCGT TCACCTTCGG CGAGCCGGTA 
CCGGTGACGG ACCTGGCCGA TTTCCTCTAC ACCGGCTGTT GGATGCTGAC GGCGCGCTGG 
TACGAACCGC CGGTGGATCT GCCAGCGCTG GCCAAGGTGT ATCGCGCGAC GGCACATCAC 
GGTTCCAGTT TGCAGGTGAA GCGCAACATT CTATCGCGAT CGTTCATTCC GCATCGCCTA 
CTGAGCCGGC AGGCGTTCCG TGCCCTGGTC ACGGATTACC TGGTGTTTGG CAATGCGTAC 
ATCGAGCGGG TGTATGGGCG CCTTGGGCGG CTGCTGGCAT TGCGGCCGGC GCGAGCCAAG 
TACGTGCGCC GAGGCGTCGA AGAAGGGCAG TACTGGTGGG TGACATCCTG GCAGGTGGCC 
AGCGAATTCG AGCGCGATTC GGTGATCCAC CTGATGGAGC CTGACATCAA CCAAGAGATC 
TACGGCGTGC CGGACTACCT CGGCGCGCTG CAGTCGATCC TACTCAACGA AAACGCTACC 
TTGTTCCGCC GCAAGTACTA CCTGAACGGT AGTCATGCCG GCTTTGTGAT GTACGTCTCC 
GATACCGCGC AGAACCAGGA AGACATCGAT GCCATGCGCG AGGCCCTGCG CAACTCCAAG 
GGCGTGGGCA ACTTCCGCAA CCTGTTCCTT CACTCGCCGG GCGGCAAGAA GGATGGCGTA 
CAGATCATCC CCATCAGCGA GGTCGCCGCC AAGGACGAAT TCGCCGGCAT CAAGCAGGAA 
ACCCGCGACG ACACCCTCGC CAGCCACCGC GTACCGCCCC AGCTGATGGG CGTGATGCCC 
AACAATGTCG GAGGATTCGG CGACGTGGAG AAGGCGGCCA GGGTCTTCGT CACCAACGAG 
CTCGAGCCGC TGCAAGCCGT CTTCGAAGAG GTCAACGACC TGGTGGGGGA GCAGGTGATC 
CGGTTTCGGC CTTACACACT TGAGGCGGCC AGCGAATCGC CAACCGGATA A

Protein sequence

MTTADKPRMR VPATLSESEP AAEASPAPAR AEAFTFGEPV PVTDLADFLY TGCWMLTARW 
YEPPVDLPAL AKVYRATAHH GSSLQVKRNI LSRSFIPHRL LSRQAFRALV TDYLVFGNAY 
IERVYGRLGR LLALRPARAK YVRRGVEEGQ YWWVTSWQVA SEFERDSVIH LMEPDINQEI 
YGVPDYLGAL QSILLNENAT LFRRKYYLNG SHAGFVMYVS DTAQNQEDID AMREALRNSK 
GVGNFRNLFL HSPGGKKDGV QIIPISEVAA KDEFAGIKQE TRDDTLASHR VPPQLMGVMP 
NNVGGFGDVE KAARVFVTNE LEPLQAVFEE VNDLVGEQVI RFRPYTLEAA SESPTG