Gene Acid345_2002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2002
Symbol
ID	4070908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2398731
End bp	2399924
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	56%
IMG OID	637984016
Product	hypothetical protein
Protein accession	YP_591077
Protein GI	94969029
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4966] Tfp pilus assembly protein PilW
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00963424
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGC GCGGCGCAAA AGGTTTCACG TTGGTCGAAC TGCTGGTGGC AATCAGCCTT 
GGATTGCTGG TTACCGGTGC AGCAGTCGCT GTCTACAAAC AGGCAGTAGA CAGTACGACC 
TACCTCACGC AGCGAACTGT CGTCCAAGGC AATGCTCGGG CTGCGATGAA TACGATCTCG 
CAGGACCTGA ACTTTGCCGG GTATGGGCTA CCAATCGGCG GAATTCCAGT GCCGACGGCC 
GCGCTCTTTA GCTGCGCTAC TGGAAGCGCC GCCGCGTCCT GGGCATATAG CTGCCCGACG 
ACTGCGCCAT CGTTCCCGGT TATCTCGGGC GCCGCGACCA TGTCCGGCAT CACGCCGATG 
TATCAGGCCG GCCCGACGAT CAACGGAAAC GCAACTGACC AGATGGCAAT GGCTTATGTT 
GACAGCTCTC CAAATTTTTC CAACAACACT TGCGGGGTTT CTACGCAATG TGGGTTTGAC 
GCATTCCCAT TGACGCAGGC GTCGGTGTCT GGCAGTACAA CGACGCTTTA CTTCAACGGT 
TCGACTACTC CGGCGCCAAA CGATACCAAG TGGGGTTTGA AGGTTGGGGA CATCCTGCTG 
GTCTCGAACT CCACCGGCCA GGCCGTAGGA GAAGTCACGA GCGTAACCTC GGGCAATGTT 
GTGCTCGCTG CAAGTGATCC GATGAAGTTG AATCAGGCGT TCGGGACAGG CGGATCGGTG 
CCCAATGTCC TCGGATTCAG TTCAGGTATC CAAGCTTACA ACAACGGAGC AGGCCCCCTG 
CAGTCAACAA ACGTGAAGCG TCTGTACATC GTGACTTACT ACGTAGCCAC AGATCCTTTG 
GCGCAGGCGG TGGGAACAAC TGGAAATCCG ACGCGCCTGT ACCGGATGGT GAACGGCGAT 
TCCAATACCA ATCCCCCGGT TCCAGTGGCA GAACAGATTT CCAATCTGAC CTTCAGCTAC 
AACATGTTCG ATTCTGTCTG TGGCGGTTCA CAGTCCGCCA ACCAACGCAA TCCGACAACG 
AACCAAATCG GCTTGATCAA GACGATCAAT GCCAGCATTT TTGCGGCGAG CACACTCAAC 
ACGACAGCTA TTCCCGGCCA GGCCATCCAG CAGATTCCGA TGACCACCAC AGTTTCGCCA 
AGGAACCTCA GTTATTTCGA CTCGTATTCT TCGACGCCGC AAGGCAGTTG CTAA

Protein sequence

MKMRGAKGFT LVELLVAISL GLLVTGAAVA VYKQAVDSTT YLTQRTVVQG NARAAMNTIS 
QDLNFAGYGL PIGGIPVPTA ALFSCATGSA AASWAYSCPT TAPSFPVISG AATMSGITPM 
YQAGPTINGN ATDQMAMAYV DSSPNFSNNT CGVSTQCGFD AFPLTQASVS GSTTTLYFNG 
STTPAPNDTK WGLKVGDILL VSNSTGQAVG EVTSVTSGNV VLAASDPMKL NQAFGTGGSV 
PNVLGFSSGI QAYNNGAGPL QSTNVKRLYI VTYYVATDPL AQAVGTTGNP TRLYRMVNGD 
SNTNPPVPVA EQISNLTFSY NMFDSVCGGS QSANQRNPTT NQIGLIKTIN ASIFAASTLN 
TTAIPGQAIQ QIPMTTTVSP RNLSYFDSYS STPQGSC