Gene Csal_0094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0094
Symbol
ID	4026016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	118198
End bp	120234
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	63%
IMG OID	637965245
Product	TonB-dependent receptor
Protein accession	YP_572157
Protein GI	92112229
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0917922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCATC GCTACCTTCC TGCTTCCCTG CTGCTTGGCG CCTTGAGCGC TTCCGGCGCC 
GCGTTCTCCC AGACGATCTC GCCGGAGGTG ATGGAGGTGA CGGCGCCGCG CCTCGATCGC 
GAGCTCTATG CCACACCCGC CGCCGTTTCC GTGGTCGACC GCGACAGCAT TGCGCAAGGC 
CAGCAGCGTG TTCGGCTCGA CGAGTCGCTG GTGACCGTGC CCGGGGTGTT CCTGCAAAAC 
CGTGACAACT TCGCCCAGGG CGAGCGCCTG GCGATTCGTG GCTTCGGCGC ACGGGCACCG 
TTCGGTGTAC GTGGAGTCAC GGTGATGGCC GACGGGATTC CCTACACGCT GCCCGATGGG 
CAGGCGCAGC TGGATGCCAT CGACCTCGAC AGCGCCCAGC GGATCGAGGT GATCCGCGGA 
CCGTCGTCGG TGCTCTACGG CAATGCGGCC GGTGGCGTGC TGAGCGTGAC CACGGCCGAT 
GGCCGTGACG ACCAGAAGAC TCGCCTGGGG GCCGAGATCG GCAGCGACGG CTACCGGAAA 
TATCGCTTCA GCGATGGCGG CGTGAACGGC CCCTGGTCCC ATCATGTGAG CGTCTCGGCG 
CTGAATTTCG ACGGGTACCG GGATCAGAGC CAGGTGGAGA AATACCATCT GAACGCCAAG 
GTGCGCCGTG AGCTGGGCAA TGATCGGGCA CTGACGGCCA TCGTCAACTT GCTGGACAAT 
CCGCGCTCCG AGGACCCGGG CGGACTGACG CGCGAGCAGG TCGATGAAGA CCGTAACCAG 
GCCGGCGACT TCACCGAGGA ATACGACACG GGCCAGAACG TCGACCAGCA GGTGCTGGGG 
CTGCAGTACG AGGATCTGTC CGCCGGGCCG GGCGAGCTGT ACGTCAAAGG CTTCTATCTA 
CAGCGTGACT TCGAACAGCA ACTGCCCTAT CCCGGCGACA GTCTCCTCGG CTACGAGCGT 
GACTACTTCG GGGGCAGTGC CGAGTATCAC CAGGATCTGC TGCTGGGCGA GCTGCCGCTG 
CGATATGTGG TCGGTGTCGA TGTGGCGCGT CAAGAGGACG ATCGCTGGCG GCGTAACGTC 
GAGTTCGATG GCACGGTCGG CGGTGACACC GCCGACGAGA CCCAGACGGC CACTTCGCTG 
GGTATTTTCG CCCAGGGCGA TCTGGATCTC ACCGACAAGT TGACGCTATC GCTGGGGACC 
CGCTACGACC GCGTCGACTT CGACATCGAC GATGATTTCG GCAGCGACGG CGACCAGAGC 
GGCGACCGTA CCTTCCGCGA ATGGAGCGGC TCGGCGGGCT TGAGCTATCG GTACTTGCCG 
ACGCATCAGG CTTATGTCAA TACCGGCACG TCTTTTGAAA CTCCCACGTT TTCTGAATTC 
GCCAACCCCA GTGGCGTGGG CGGCTTCAAT CCTGCCGTCG AGCCACAGAA GGCCTGGAAT 
CGCGAAATCG GGCTGCGGGG GAATTTCGAC AATGGCGTGG ATTACGATCT GGCGCTGTTC 
TCGGTGCGTG TGCGCGACGA GCTGGTGCCT TACAACGAGA ATGGGCGGGA CTTTTACCGC 
AATGCCGGCG ATTCCTCGCG GGATGGTATC GAGCTGGCGC TGGGCTGGCA GATGACGCCG 
AGCTGGCGTC TCGACAGTGC CTTGACGCTG GCCAGGTACG AATTCGATGA ATACGACACC 
CAGGATGGCA ACTACGGGGG CAACCGCATC CCCGGCCTGC CGGAGCAGAC CTGGATGAAC 
CGGCTGACCT GGAAGGGCTT CGACGAGCGC TTCGCGACGC TCGAGACGCA GTACATCGGC 
GACATGGTGG CGGACGACGC CAACGATGTG GCGGTCGACG ATTACTGGCT GGTCCACCTG 
CGCGCCGGCG ATGGCTGGCA CCTGGGTGGC GATACCTTGC TCAAGGGCTA CGTGGGGGTG 
CGTAACCTCT TCGATCGCGA GCATTTCGCC AATGTGCGGA TCAATGCCAA TAACGACCGC 
TATTTCGAAC CGGCATCGGG ACGGACCGTC TACGCTGGTA TGGAAGTCGC GTTCTAG

Protein sequence

MTHRYLPASL LLGALSASGA AFSQTISPEV MEVTAPRLDR ELYATPAAVS VVDRDSIAQG 
QQRVRLDESL VTVPGVFLQN RDNFAQGERL AIRGFGARAP FGVRGVTVMA DGIPYTLPDG 
QAQLDAIDLD SAQRIEVIRG PSSVLYGNAA GGVLSVTTAD GRDDQKTRLG AEIGSDGYRK 
YRFSDGGVNG PWSHHVSVSA LNFDGYRDQS QVEKYHLNAK VRRELGNDRA LTAIVNLLDN 
PRSEDPGGLT REQVDEDRNQ AGDFTEEYDT GQNVDQQVLG LQYEDLSAGP GELYVKGFYL 
QRDFEQQLPY PGDSLLGYER DYFGGSAEYH QDLLLGELPL RYVVGVDVAR QEDDRWRRNV 
EFDGTVGGDT ADETQTATSL GIFAQGDLDL TDKLTLSLGT RYDRVDFDID DDFGSDGDQS 
GDRTFREWSG SAGLSYRYLP THQAYVNTGT SFETPTFSEF ANPSGVGGFN PAVEPQKAWN 
REIGLRGNFD NGVDYDLALF SVRVRDELVP YNENGRDFYR NAGDSSRDGI ELALGWQMTP 
SWRLDSALTL ARYEFDEYDT QDGNYGGNRI PGLPEQTWMN RLTWKGFDER FATLETQYIG 
DMVADDANDV AVDDYWLVHL RAGDGWHLGG DTLLKGYVGV RNLFDREHFA NVRINANNDR 
YFEPASGRTV YAGMEVAF