Gene Csal_0144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0144
Symbol
ID	4027285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	166260
End bp	167510
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	62%
IMG OID	637965295
Product	hypothetical protein
Protein accession	YP_572207
Protein GI	92112279
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCCG TTGCCATGAC ATCGACACCC ATTCTCGCAT GCTGGACTCT CTCGCTATTC 
GGCGCCGCAT CGATCGCCCA CGCGGCGCCT GCCGACGAGG CGACGCCTCC CGTCAGGGAA 
GACGCTCCCA CGACACCGCA AACGGCCCAG AGCTGGGCCG ATGCCCTGGA ATTGGGTGGA 
GCGCTGCGCT TCAATCATCG CTACGAGGAC TGGTCGTCGA GCGACAAGCA GCAAGGCGGT 
GGCGATATCG ATTTCGATGC CTTCTACCTC GACCTGGAAG CGGAAAAGGA CGACCTCTTC 
CTGGATCTTT CTTATTGGTT CAAGGACAAC GACGTCCGTG TCCTGGAGCA CGGCTTCTTC 
GGCTACCGCT TTTCTTCCCG CTCGCGCCTG GAAATGGGGG CCACGTTCGA GCCGTTCGGT 
ATCATGCCGT ATCCGCAATT CGGCTGGACC TTCAACATCC CCTTCTACCT GGGGATGGGT 
CACAACACCG CGCTGGGGGC CAAATACGTC TACGAAGGTC CCGAGTGGGA GGCGCAGGTC 
GGCTTCTTCA AGAACCCGCT GTCGCTGGAT ACGCGTTATG CGCCTAACAT GGCATCCGCC 
GATGACGTCG ACGACGCCTT CCTTGCTCCC ACCAACAGCG GGCAAGCCAA CGAGAAGCAG 
AATCAACTGA GTGGCCGCCT GGTGCGGACC TTCCAGGGCG ACGGATGGGA AAGTCGACTG 
GGGGCCTCGG CATACGTCGG ACAGTTGCAC AACGACACGA CGGACCGTAA CGGCAGCTAC 
TGGGGCACGG AACTGCACGC CTTGACGACC TTCGGTCCTT GGCAGGTGCA GCTCCAGGGC 
ATTCGTTATG TCTTCGACCC CGAGAATCCC GAGGGCGTGA GCGACGACAG CGTGCTCTTT 
GCCGGCCCGG GGACACCGAG TTACCGCGTG GCCGCGAAAG GGACCGTGGG GGTGCTCAAC 
ATTGCCTACG ACTTGCCGAC GCCGCGCCTC GGCCCGGTCA AGAAGCTGCG TTTCTACAAC 
GACTACAGTC GGCTGGTGAA AGACCGCAGT GGTTGGGACG ACTCGCAGAT GGAAACCGTC 
GGTGTACAGT TCTTCGCCTT GCCGGTGATG GGGTGGCTGG ATGTCACCTG GGGCAAGAAC 
ATGAACATGA TGGGCGGCAT GCCCGGCGGT GTCGGGCTGG CCTCGGCGGA TGCGGAGGGC 
AGTGGCGAAT GGGAGCTACG CACCAACCTC AATATCGGCT ATTACTTCTA G

Protein sequence

MNPVAMTSTP ILACWTLSLF GAASIAHAAP ADEATPPVRE DAPTTPQTAQ SWADALELGG 
ALRFNHRYED WSSSDKQQGG GDIDFDAFYL DLEAEKDDLF LDLSYWFKDN DVRVLEHGFF 
GYRFSSRSRL EMGATFEPFG IMPYPQFGWT FNIPFYLGMG HNTALGAKYV YEGPEWEAQV 
GFFKNPLSLD TRYAPNMASA DDVDDAFLAP TNSGQANEKQ NQLSGRLVRT FQGDGWESRL 
GASAYVGQLH NDTTDRNGSY WGTELHALTT FGPWQVQLQG IRYVFDPENP EGVSDDSVLF 
AGPGTPSYRV AAKGTVGVLN IAYDLPTPRL GPVKKLRFYN DYSRLVKDRS GWDDSQMETV 
GVQFFALPVM GWLDVTWGKN MNMMGGMPGG VGLASADAEG SGEWELRTNL NIGYYF