Gene Csal_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3052
Symbol
ID	4028048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3401149
End bp	3402306
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	64%
IMG OID	637968264
Product	twitching motility protein
Protein accession	YP_575095
Protein GI	92115167
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5008] Tfp pilus assembly protein, ATPase PilU
TIGRFAM ID	[TIGR01420] pilus retraction protein PilT

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.316107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCCGC ATGAATGGCT GACGCAACTG CTGGATATCA TGCTCGACAA GCAGGCCTCC 
GATCTGCTCG TGTCCACGGG GGCGCCGCCG AGTCTCAAGA TCGATGGCGC ACTGGTCACG 
CTGGGAGACA AGGCGATGTC GGTGGGGCAA GTGCGTGAAC TGGTCTCGGC GGCGCTGCCT 
CAGGGGGTAC GCGAACGCTT CGAGGCCGAG CGCGAGGCCA ACTTTGCGCT CAGCGTGCCG 
GGCAAGGGGC GCTTTCGTGT CAGCGCCTTC TACCAGCGTA GCCAGATGGC GATGGTCGTG 
CGGCGCATCG CCTACGATAT CCCCGACCTG GAAAGCCTGG CCCTGCCCTC GGCGCTGGGG 
GAACTGGTCA ATCGTCAGCG TGGTTTGGTA TTCATCGTCG GCGGCACGGG AAGCGGCAAG 
TCGACGACGC TGGCGTCGAT GATCCAGCAT CGCAACCAGA CCACCGGGGG GCACGTGATC 
AGCATCGAGG ACCCCATCGA GTACATTCAC CCTCACGGGC GGGCGATCAT CAACCAGCGG 
GAAGTGGGCA TCGATACCGA GTCCTTCGAG GTGGCGCTCA AGAATGCGCT GCGCCAGGCG 
CCGGACGTGA TCCTGATCGG CGAGGTTCGT TCGCGCGAAG TCATGGAGCA TGCCCTGACC 
TTTGCCGAAA CCGGGCATCT GTGCCTGGCG ACGCTGCATG CCAATAACGC CAACCAGGCC 
CTGGAGCGCA TTCAGCACTT CTTTCCCAGC GAGCGCCACG AACAGGTGTG GATGGACCTT 
TCGCTCAACC TGCAGGCCAT CGTCGCGCAG CGTCTGTTGC CTCGCGAGGA TGGCGAGGGG 
CGGTGCGCGG CCGTCGAGGT GATGCTGCGC TCGCCGCTGA TCAGCGACCT GATTCGCAAG 
GGAGCGATTC ACGATATCAA GGAGGTCATG CAGCGCTCAC GGGATCAGGG CATGCAGACC 
TTCGACCAGG CCCTGTACGC GCTCTACCGA CAAGGGCGGA TCAGCGAAAA GATGGCGCTG 
GTGCATGCCG ATTCCGCCAA CGACCTGCGT CTGCAAATCG CCTATGGCGA TGCCGAGAGC 
CCGCAACTGG CGAGGGCTGC CGATGCCGCC GAGCGCTTCA CCCTGAAAGG CGATGACGAG 
TGGCGCGAGG ATGAGTGA

Protein sequence

MTPHEWLTQL LDIMLDKQAS DLLVSTGAPP SLKIDGALVT LGDKAMSVGQ VRELVSAALP 
QGVRERFEAE REANFALSVP GKGRFRVSAF YQRSQMAMVV RRIAYDIPDL ESLALPSALG 
ELVNRQRGLV FIVGGTGSGK STTLASMIQH RNQTTGGHVI SIEDPIEYIH PHGRAIINQR 
EVGIDTESFE VALKNALRQA PDVILIGEVR SREVMEHALT FAETGHLCLA TLHANNANQA 
LERIQHFFPS ERHEQVWMDL SLNLQAIVAQ RLLPREDGEG RCAAVEVMLR SPLISDLIRK 
GAIHDIKEVM QRSRDQGMQT FDQALYALYR QGRISEKMAL VHADSANDLR LQIAYGDAES 
PQLARAADAA ERFTLKGDDE WREDE