Gene Veis_4398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4398
Symbol
ID	4694421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4845634
End bp	4847154
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	65%
IMG OID	639852147
Product	flagellin domain-containing protein
Protein accession	YP_999119
Protein GI	121611312
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.308154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.749909
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCA CGATCAACAC CAATATTGCG TCGCTGACCG CACAGCGCAA TCTGGGCCTG 
AGCCAGTCGT CGCTGAACAC CTCGATACAG CGCCTGTCCT CGGGCCTGCG CATCAACAGC 
GCCAAGGACG ATGCGGCGGG GCTGGCGATT TCCGAGCGCT TTACGAGCCA GATTCGCGGC 
CTGGACCAGG CGGCGCGCAA CGCCAATGAC GGCATCTCGC TGGCCCAGGT CACCGAAGGG 
GCGATGAAGT CGGCCAGCGA CATCTTGCAG CGGGTGCGCG AGTTGGCGGT GCAGTCGGCC 
AATGCGTCCA ACAGCCCCGG CGACCGCCAG GCGCTGAACC AGGAAGTGGG CCAGTTGGTC 
AGCGAGCTCG ATCGCATTGC GCAAACCACT GAATTCAACG GCGCCAAATT GCTCGACGGC 
AGCTTTGGCA CGCAGCAGTT CCAGGTGGGC GCCAATGCCA ACCAGACCAT CGTCGCGGCC 
ACGGCCAATC TGCGCACCGG CGTGTATGGC AACAACCAAA ACACGGCGGC CAATGGCGCC 
GGCGCCGATG CCAACATGGG CGCCGATGCC GCCTGGGGGA GCAACGGTGT CGGCACCGGG 
GCATTGGCCA TCAGCGGCGC GCTCGGCTCG GCCAGCATCG GCATCGAGGC GAACCACACG 
GCCAAGGCCA TGGCCGACGC CATCAACCTG AAAACCGCCG ATACCGGCGT CACGGCCTCG 
GCGCGCACCG AGGTGCAGTT GTCCTTTTCT GCGCCCGGCG CTTACACCTT CCAGTTGCGC 
AGCGAAAACC GCCCGAACCC GCCCGCGCTC GGGCAGCCGA TGGCGTTCCA TGTGACGGCG 
ACCGGTACGA TCGACGGCTT GTCGAACGCG ATTGCCGCGA TCAATGAGCA ATCGGCCAAG 
ACCGGGGTCA CCGCCGCGCT GAACCCGGGC GCCACCGGCA TCGTGCTGAC CAACACCACG 
GGGCAGGACA TCGGCCTGTA CAAAAGCGCC AGTGACAGCG GCAATGCGGG CACGATCACT 
GTCCAAAAGC AAAACGCCGA TGGCCTGCCC GCAGGCAGCG CGGGCGCCTT GGCGGCCGCC 
GCCGGCGTTG GCAATGCCAC CGTCAGCGGG TATGTGGTGC TCGATGCGAA CAAGCCCTTT 
TCCACGACCG TCACCACCAC GAACGCTTTC AACACCACGG CTCCCGCCGA CTCCGCCTCC 
TCGCTGCAAG AAGTGGCCGG CCTGGATGTG ACGACATTCA AAAATGCGAC CGAGGCCCTC 
AAGACCGTGG ACTCTGCGCT GTCGTTCATC AATGGCGAGC GCGCCAAGCT CGGCGCGTTG 
CAGTCGCGCT TCGAGAGCAC CATCGCCTCG CTGAACATCA CCTCGGAAAA CCTGTCGGCA 
TCGCGCTCGC GCATCCTCGA CGCCGACTTC GCCACCGAGA CGGCGAACCT GTCGCGCGCC 
CAAATCCTGC AACAGGCCGG CACCGCGATG GTGGCCCAGG CGAACCAGAT TCCGCAAGGC 
GTGCTCAAGC TGTTGCAGTA G

Protein sequence

MAATINTNIA SLTAQRNLGL SQSSLNTSIQ RLSSGLRINS AKDDAAGLAI SERFTSQIRG 
LDQAARNAND GISLAQVTEG AMKSASDILQ RVRELAVQSA NASNSPGDRQ ALNQEVGQLV 
SELDRIAQTT EFNGAKLLDG SFGTQQFQVG ANANQTIVAA TANLRTGVYG NNQNTAANGA 
GADANMGADA AWGSNGVGTG ALAISGALGS ASIGIEANHT AKAMADAINL KTADTGVTAS 
ARTEVQLSFS APGAYTFQLR SENRPNPPAL GQPMAFHVTA TGTIDGLSNA IAAINEQSAK 
TGVTAALNPG ATGIVLTNTT GQDIGLYKSA SDSGNAGTIT VQKQNADGLP AGSAGALAAA 
AGVGNATVSG YVVLDANKPF STTVTTTNAF NTTAPADSAS SLQEVAGLDV TTFKNATEAL 
KTVDSALSFI NGERAKLGAL QSRFESTIAS LNITSENLSA SRSRILDADF ATETANLSRA 
QILQQAGTAM VAQANQIPQG VLKLLQ