Gene Csal_3150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3150
Symbol
ID	4028617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3505877
End bp	3507052
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	637968364
Product	hypothetical protein
Protein accession	YP_575193
Protein GI	92115265
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000826288
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGAA GCAGGCATGC CAAGCAGCGG CGATGGGTTC AGGCCTCTCT TGCCGCCGTT 
ATGATGGCTA CCCTCAACGG TTGTCCGACC ATGGCCGATT ATGGTGCTGC GACCAGCGGT 
AATAACAGCG ATTTCGTGGC TCCCCATGAG CAGTTCCAAG TCGATTCGAT GGACTATCCG 
GTTTTTGCTG TCATACAAGA CCACATCGCT CCACGCTCCA ATGTTAACTA TCCGCAAAAT 
AATGGCCGGG AAATGCCCGC GTTAAAGGAA AATTACCGCT GGCAGGTTAC TCACAAGGTG 
CATGGTGAGT ATTTGATCGG TTCCGAGAGC TTCGATCAAA CTAGTTGTAG CTGGACAAAG 
GACGGTCGGG ACCATCCGGA GCATTGCGAG CCGGGAGGCA TCGGCGCGGA ATATCTGGAT 
CGTATCTATG TCTACCCGGA CGGCTCCGCC TATGCCTACG GCTACTTGAA GAACACTCCC 
CGGTGGCCGC ACTGGTTCGG CAAGGACGAG ACCTGGTTCC GGCATGATGA TACCGGGGAC 
TGGTCCGGTC AGCCTTGGTT CGAGTGTGTG GCACGCTGTG ACAAGCTGAA AAATATGAGT 
GCCGATAGAG ATGCCCAGGC TTTGGTTCAA AAAGTGAATA AGAGCACTGC CGCTATTCAC 
AAATCTGTGA TCAACGTTGA CGCTGATTAC TTCACGATAC GCCAAGAAAA ATTGCAGGTC 
GATCCGATGG ATTATCCGGT TTTTGCCGTC AGTCAAGACC GCGAGGCACC GCGTGCTGGT 
GTGAGTGGAA AGATTTTTAC TCCTTCATGG TTTGGTCAGA AAATGCTGCC ACTGAAGAAA 
AGCTATCGCT GGAGGGTCAC GCATAAATTC CACGGTGAAT ATCTGATTGG TTCCAAGCAG 
TACGATCAAG CTAATTGCCG TCAGACAGTT GATGGCCGGG ATCAACCAGA GCATTGCGAG 
CCAGGTGGAA TCGGCGCCGA AATCTTGAAT CGTATCTATA TTCATCCGGA TGGTTCGGCT 
TATGCTTACG CCTTTCTCAA GAACACCCAG CGATGGCCGC CAGGCAAGCA GGAGACTCTA 
TTACGGCATG ACGATAGCGG GGACTGGTCC GGTCAGCCGT GGTTCGAGTG CGTGGCTCGG 
TGCGACAAGC TGAAAAATAT GCGAGCCGAT CCATAG

Protein sequence

MARSRHAKQR RWVQASLAAV MMATLNGCPT MADYGAATSG NNSDFVAPHE QFQVDSMDYP 
VFAVIQDHIA PRSNVNYPQN NGREMPALKE NYRWQVTHKV HGEYLIGSES FDQTSCSWTK 
DGRDHPEHCE PGGIGAEYLD RIYVYPDGSA YAYGYLKNTP RWPHWFGKDE TWFRHDDTGD 
WSGQPWFECV ARCDKLKNMS ADRDAQALVQ KVNKSTAAIH KSVINVDADY FTIRQEKLQV 
DPMDYPVFAV SQDREAPRAG VSGKIFTPSW FGQKMLPLKK SYRWRVTHKF HGEYLIGSKQ 
YDQANCRQTV DGRDQPEHCE PGGIGAEILN RIYIHPDGSA YAYAFLKNTQ RWPPGKQETL 
LRHDDSGDWS GQPWFECVAR CDKLKNMRAD P