Gene Jann_4203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_4203
Symbol
ID	3936692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	4307717
End bp	4309285
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	59%
IMG OID	637906589
Product	flagellin-like
Protein accession	YP_512145
Protein GI	89056694
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.618409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGCA TTCTGACGAA TAGCAGCGCG ATGGTTGCGT TGCAGACCCT TAAGTCGGTC 
AACTCCAACC TCCAGCAAAC CCAATCGGAA ATTTCGACCG GTAAGTCCGT GGCCTCCGCC 
AAGGACAACT CTGCCGTTTG GGCGATCTCC AAAGTCATGG AATCGGACGT CAAAGGTTTT 
AAAGGCATCC AGGAAAGCCT GAGCCTCGGT GAATCTACTG TCGCGGTTGC ACGGAACGCC 
TCCGAAACCG TGACCGACCT TCTGACCGAC ATCAAAGGGA AGATTGTCGC GGCCCAGGAA 
GAGAATGTTG ATCGCGAGAA GATCCAGACT GACATTGATG CCCTGACCGA CCAGATCAAA 
ACGGTTGTTG GCGCGGCGCA GTTCAACGGC CTGAACCTTG TCCAAGGGAC CGAGGATGTG 
AATATCCTGT CGTCCCTGGA CCGTTCGGGC AATGGTGATG TTTCGGCCGC AAGCATCACC 
GTCGCTCGTC AAGATCTCAG CACTGAGACC GGTCAATACG GAAGTACGGC CGTCACCGGG 
GGTGACCTGA CGGCCTTGGG CTCTGTTAAT GGCGCAGCCT CCGGGACCAG CGGTGCGCAA 
GCCGGTTTGA ACGCTCAGAT CCAAGTCACG GAAGGCGGCG GTGCTGGCTT TGCTGACGGT 
GATACGTTCA GCCTTACCGT GGGCGGTTCA AGCTTTACCG TCTCTCTCGC TGGGACCGAG 
AGTGCGACGG ATGTGGCCAC GTTGCTGCAA GGCGAGATCA ACGCCCGTGA CATTGATGGT 
GTTACCGCTA CGCTGGGTGC AAACCCTGGT GAACTGGTCA TCTCCAACAC CAACGCCTTT 
GAAGATGTTG ATGTGTCTGT TTCGTCGAGC CTGACTGACA CTACCGGCGG TGCCGGCGCG 
AACCTCGAAG AGCTCAACGG CGCCACCGGC CTGACCCAGA CGTCTGGTAC GATTGCCCAA 
CGAGCCGAAG CAATTGACTT CAGCGCTGCA GCAAACGTCG CCGAAGGAGA TGGCTTTGAG 
GTGACCGTCG CGGGTGCAGC GTTCCGCTAC GTCGCGGGTG CTGGTGAAAC GATGGAGGAT 
GTGGCGCGCG GGTTGAAAAC AGCCATCGAC TCCAATCCCC CGGATGGTGT GACCACCAAG 
GTCCAATTGG ATGATGCAAC TGGTGCCTAC TCCCTTGCCA TCGACTACGA CAACGCGTCG 
ACCACAACGA TCGCGCTTGC GGCGTCGACG GGCGGTGAGG CATCGGGTGG CCTGTTCGGC 
TTGGACAGCC TTGACGTGAC CACCAACGCT GGCGCGGACT CGGCTCTCGA CAACATCGAA 
AGCCTGATCC AGAACTCGAT CGACGCAGCC GCAGAATTTG GTTCTGCTGG TGGGCGGATC 
GAGACGCAGT CAGAGTTTGT CGGCAAGCTG GTGGATTCAC TGAAGTCCGG AATCGGCACG 
TTGGTAGATG CGGATCTGGA AGAGACGTCG GCACGCCTGC AGGCGCTGCA GGTGCAACAG 
CAGTTGGCAA CCCAGTCGCT GTCCATTGCC AACCAGGCCC CCCAGAACAT CCTGTCGCTG 
TTCCGGTAA

Protein sequence

MSSILTNSSA MVALQTLKSV NSNLQQTQSE ISTGKSVASA KDNSAVWAIS KVMESDVKGF 
KGIQESLSLG ESTVAVARNA SETVTDLLTD IKGKIVAAQE ENVDREKIQT DIDALTDQIK 
TVVGAAQFNG LNLVQGTEDV NILSSLDRSG NGDVSAASIT VARQDLSTET GQYGSTAVTG 
GDLTALGSVN GAASGTSGAQ AGLNAQIQVT EGGGAGFADG DTFSLTVGGS SFTVSLAGTE 
SATDVATLLQ GEINARDIDG VTATLGANPG ELVISNTNAF EDVDVSVSSS LTDTTGGAGA 
NLEELNGATG LTQTSGTIAQ RAEAIDFSAA ANVAEGDGFE VTVAGAAFRY VAGAGETMED 
VARGLKTAID SNPPDGVTTK VQLDDATGAY SLAIDYDNAS TTTIALAAST GGEASGGLFG 
LDSLDVTTNA GADSALDNIE SLIQNSIDAA AEFGSAGGRI ETQSEFVGKL VDSLKSGIGT 
LVDADLEETS ARLQALQVQQ QLATQSLSIA NQAPQNILSL FR