Gene Acid345_2935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2935
Symbol
ID	4070859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3479040
End bp	3480188
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	60%
IMG OID	637984954
Product	flagellin-like
Protein accession	YP_592010
Protein GI	94969962
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTCA GCATCCTGAA CAATATTCCG TCCTTGGCGG CACAGAACCA GTTGTCCATA 
ACGAACAGCA GCCTGCAAAA GACACTGATT CAGCTCTCCT CCGGGCAACG CATCAATTCT 
GGTGCGGACG ATGCGGCTGG CCTCTCGATT GCCGACGGAC TCAATGCGAA CATCGCTGCG 
CTGACACAGT CTGCACGCAA TGCCACGGAC GGCGTGGGCA AGCTCCAGGT TGCCGATGGT 
GCGCTTTCGC AAGTGACGAC CCTGTTGAAC CGCGCGGTGA CCCTGGCAAC CGAATCTGCC 
AACGGAACGC TTAACGGTGA CGGCGGCTCG CAGCGTACCG CACTGCAAAC CGAGTTCGCG 
TCAATCAAGG CCGAAATCGA CCGCATTGGC CAGAACACCA CGTTCAACGG AACAGCAGTA 
TTTGCGGCCG GCACTTCGAA CGATCCGAAC GTATTGATGG GCGCTACCAC GGGCAAGGCG 
CTTACCGACA CTATGACCAC GGGCGACTCG CTGAAGATCA CTGCTGGCGG CAACTCGTTC 
ACGTATTCCT ACACCTCGGG CGACACAGTG CAGAGCCTGC TCAATCAAGT CAACGCGAGT 
AACCTCGGTG TGACGGCGAG TTTGAGCAGT GGCCAGCTCA AACTGGTTGA CCAGAAGGGC 
CGCGGCGATA TCGCGATCGA TTCCAGCTCG ACGGCTACCG AGTTTGGCGG CTTCACGAAT 
GCTGCCGGCA CGGGCTCGAA CGTCTTCTCC GTGTACCTGG GCGACGGTAC GAGCTCGGGA 
GCAAGCCATA TCGACGTGAC TCTGAGCGCC TTCAGTTCGA GCAACCTGAA CGGTACGAGT 
CTCACCAGTG ACAGCCTTTC AACCGCAGCG GGCGCGAAGG CAGCGTTGAC TGACATCAAC 
GCAGCGATTT CGTCGGTGGC GGCACTACGC GGCAGCATCG GCGCGGGCAT CAATCGTCTC 
CAGGCCGCGA CCAACGTCAT CAACAACCAG ACCCAGAACC TGACGACCGC AGAGGATGGC 
GTGCGCTCGG CGGATGTGGG TCAGTCGGTT GCGAACCTCA CGAAGTACAA CATCCTGACC 
TCGACCGGCA TTTCGGCCCT GGCCCAGGCG AACCAGATGC AGCAGTCCGT CTTGAAGCTG 
TTGCAGTAA

Protein sequence

MSLSILNNIP SLAAQNQLSI TNSSLQKTLI QLSSGQRINS GADDAAGLSI ADGLNANIAA 
LTQSARNATD GVGKLQVADG ALSQVTTLLN RAVTLATESA NGTLNGDGGS QRTALQTEFA 
SIKAEIDRIG QNTTFNGTAV FAAGTSNDPN VLMGATTGKA LTDTMTTGDS LKITAGGNSF 
TYSYTSGDTV QSLLNQVNAS NLGVTASLSS GQLKLVDQKG RGDIAIDSSS TATEFGGFTN 
AAGTGSNVFS VYLGDGTSSG ASHIDVTLSA FSSSNLNGTS LTSDSLSTAA GAKAALTDIN 
AAISSVAALR GSIGAGINRL QAATNVINNQ TQNLTTAEDG VRSADVGQSV ANLTKYNILT 
STGISALAQA NQMQQSVLKL LQ