Gene Cphy_3850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3850
Symbol
ID	5744802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4714233
End bp	4715741
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	38%
IMG OID	641294962
Product	flagellin domain-containing protein
Protein accession	YP_001560936
Protein GI	160881968
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATAA ATCATAATAT TTCAGCACTT CACGGTAATA ACCAATTAAA AATTAATAAT 
AATGCATTAG ATAAGAGTTT AGAAAGATTA AGCAGTGGTT ACCGAATCAA TCGTGCAGCT 
GATGATGCGG CAGGACTTGC TATCTCAAGA AAAATGAAAA CACAGATTGA AGGTTTAGAG 
CAATCTTCAA GAAATGCTTC CGATGGTGTA TCAGTTATAC AGACAGCAGA GGGTGCATTA 
AATGAGGTTA ATGCAATGTT ACAGCGTATG AGAGAACTCT CAGTGCAAGC TGCAAACGGT 
ACCAACACTG CAGAAGATCG CTTGGCAATT CAAAAAGAGA TTAACGCGTT AAACAACGAA 
ATCACCCGTA TTTCAACAGA CACTGAGTTC AATACAAAAC CTTTATTAAA TGGAAATTTA 
GATTGCCAGA GTTATTCCAA TACCTCTGAT GTGGAAATGA TTTCTCTATC CGATAATGTA 
GATGCAAAAG ATTATAACTT TATTATAACT GGGGATGCAA GACAGGCAGT TATGACTGGA 
ATGCAATTAG GTGGACTTTC TGATCAAATT GCTGATGATC AGGCAGGCGT TATTAATATT 
AATGGTATAG AGATAAAAAT TAACGCTGGT GATACCATGG AGCAGGTATT TGAAAAGCTT 
CGTGGAGCCT GTGACACAAT GAATATTAAA GTGTTTGCTC AGGTTGGTAC ATCCGTAAAT 
CCAGACTATG ATGGATTTGC TGGCTATGAG AGTGGACCGA TTGATAATGG TTCCCTTGTA 
TTTATGACAA AGGAATATGG TTCCAATCAG ACAATTGAGA TGCATTGTGA TAACGATAAA 
CTAAGCGGCT TATTAGGTAT TAGCAGTGGT GGTGCGAAAG CTATTGGTGT AGATGCAAAA 
GCGACGTTAG GAAATGGTTT TTCCTCTACT GCTACGGCTT CTTGCAGTGG CAACATTATC 
ACAGTAACAG ACGGTGACGG CTTTGAAATT AAATTTAAGG CTACTCCTGG AGCAGCTAAA 
ACTGCATTTA CTGATCAAAC AGTAAATAAT GATGGAGCAA GCATAACAGA TGGTGCTGGT 
TCTGATAATG TTTCTATTAC AGTTTTACAA GCTGGACCTA TGGATCTTCA GATTGGTGCC 
AATGAAGGAC AAACGATGGA AGTACGAATT CCTCGTGTAG ATACTTATAC TCTTGGAACA 
AATATTGTAA ATGTTTGTAC TCAGGAGGGA GCTTCTAGTG CAATTTCCAT TCTAAGTAAA 
GCGATTACTA TGGTAACTGA TATTCGTGCA AAGCTTGGTG CATATCAAAA TCGTTTGGAG 
CATGCGATTG CAAACTTGGA TGTTGGAGCT GAAAATATTA CGGAAGCTTT ATCTCGTATC 
GAAGATACCG ATATGGCAAA AGAAATGTCC TTATTTACTC AGAAAAACGT GTTAGTACAA 
GCAGGCACTG CTATGTTAGC GCAAGCGAAT CAGAGACCAC AGAATATTCT ATCCTTATTA 
CAAAGTTAA

Protein sequence

MRINHNISAL HGNNQLKINN NALDKSLERL SSGYRINRAA DDAAGLAISR KMKTQIEGLE 
QSSRNASDGV SVIQTAEGAL NEVNAMLQRM RELSVQAANG TNTAEDRLAI QKEINALNNE 
ITRISTDTEF NTKPLLNGNL DCQSYSNTSD VEMISLSDNV DAKDYNFIIT GDARQAVMTG 
MQLGGLSDQI ADDQAGVINI NGIEIKINAG DTMEQVFEKL RGACDTMNIK VFAQVGTSVN 
PDYDGFAGYE SGPIDNGSLV FMTKEYGSNQ TIEMHCDNDK LSGLLGISSG GAKAIGVDAK 
ATLGNGFSST ATASCSGNII TVTDGDGFEI KFKATPGAAK TAFTDQTVNN DGASITDGAG 
SDNVSITVLQ AGPMDLQIGA NEGQTMEVRI PRVDTYTLGT NIVNVCTQEG ASSAISILSK 
AITMVTDIRA KLGAYQNRLE HAIANLDVGA ENITEALSRI EDTDMAKEMS LFTQKNVLVQ 
AGTAMLAQAN QRPQNILSLL QS