Gene Acid345_4277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4277
Symbol
ID	4071850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5082952
End bp	5084358
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	61%
IMG OID	637986310
Product	TPR repeat-containing protein
Protein accession	YP_593351
Protein GI	94971303
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0190966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTCT CTGCCTGCTT GTTGTTGCTC CTCTCGCTAG GATCGCTATC GCTGTCCGCC 
GAAACCATCG TGCTCAAGAA TGGCCGCAAG ATCCTCGTCG ACTCCGTTCG CGAAGAGAAA 
GACAAAGTCC TCTACGAGAT TGGTGACTCC AGCTACGCCA TCCCCAAATC CTCGGTCGAT 
CACATTGACG CGTTCGGATC TCCATTGTCA TCGCACGGGC CTGCTGCCGC CCCCGAATTC 
GTCCCACAAA CTGCCACTCC CGTCTTCGGA GCCGCGGCCG AAGTGCATGT CATCAAGAAC 
GACCGCATTG ACGACGTGGC CATTGCGGAT GCCGAGCGCA ATGGCGATGC CGCAACCGCT 
GCCGCCGCTA ACTTCATGGC CGGACGCTTT GCCCTGGAAC AAGGTGATCG AGATGCTGCC 
GCCCGCTACT TTGACCGCGC TCTGCGCTTC AAGTCCGACG ATGCCAACGT TCTGATCAAC 
TACGCCGCCG TGCTTGTCCG CACCGGACGC CCACAGGAAG CACTGCCGCT GGCCGAGCGT 
GCCGTTCGCG CCGCGCCAGA TTCGCCCGAC GCCTGGGCCG TGCTCGGCTA CGCCAACCTC 
CAGGCCGATC GCTCCAAGGA CGCGATCCCG GCATTCGAGA AGTCTCTTAA GCTCCGTCCC 
GACCCGACCG TCGAAGCCTT CCTCAAGCGC GCGCATAAGG AAACCACGAC GGAAGCCGAC 
TACACTGCCG CCGAGAGCAG CCACTTCACC CTGCGCTTCG AGGGAAAGGC CTCGCAGAAC 
GGCCTTCCCC GCGACATCCT CGAGCAGCTC GACTCCGATT ACGACGGCCT CGTCAGCCAA 
CTCGGCGTCG CCCCCCACGG CAGCATCACG GTCATCCTTT ATACCGAGCA GGCATTCTTT 
GACGTCACCC AGGCTCCGTC TTGGTCCGGC GCCATCAACG ACGGTAAGCT CCGCATCCCG 
ATCAGCGGCG TCTCGCAGAT GACCAGCGAA CTGGCGCGCG TGCTCCGTCA CGAGCTCACT 
CATTCGTTCA TCACCCAGAT CGCCCGCGGA CGCTGCCCCT ACTGGCTCAA CGAGGGTGTG 
GCGCAGCTCA TGGAACCGAA AAGCATCTCC AGCGCGGGAC CACTGCTCGC CAAGCTTTAT 
GCCAGCCAAA GGGAGATCCC GCTCAACGCG CTCGAAGGCT CGTTCATGGG TCTGGACGGT 
AATTCTGCCG CCATCGCTTA TGCCGAATCA CTCACTGCCG TCGAATACAT TAATGATACG 
TACGGCATGA GCGACGTCCG GCGTCTCCTG GAACGAATCG GGGAAGGCTC ATCCACGGAA 
GCCGCGTTGC GCAGCACCTT CAATGTGGGT TATGGGCAGT TCGAGGAAGA CATCGCGACC 
TACCTCAAGA GCAAGTACGG ACAATAA

Protein sequence

MRFSACLLLL LSLGSLSLSA ETIVLKNGRK ILVDSVREEK DKVLYEIGDS SYAIPKSSVD 
HIDAFGSPLS SHGPAAAPEF VPQTATPVFG AAAEVHVIKN DRIDDVAIAD AERNGDAATA 
AAANFMAGRF ALEQGDRDAA ARYFDRALRF KSDDANVLIN YAAVLVRTGR PQEALPLAER 
AVRAAPDSPD AWAVLGYANL QADRSKDAIP AFEKSLKLRP DPTVEAFLKR AHKETTTEAD 
YTAAESSHFT LRFEGKASQN GLPRDILEQL DSDYDGLVSQ LGVAPHGSIT VILYTEQAFF 
DVTQAPSWSG AINDGKLRIP ISGVSQMTSE LARVLRHELT HSFITQIARG RCPYWLNEGV 
AQLMEPKSIS SAGPLLAKLY ASQREIPLNA LEGSFMGLDG NSAAIAYAES LTAVEYINDT 
YGMSDVRRLL ERIGEGSSTE AALRSTFNVG YGQFEEDIAT YLKSKYGQ