Gene Acid345_2936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2936
Symbol
ID	4070860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3480306
End bp	3481646
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	637984955
Product	flagellar hook-associated 2-like
Protein accession	YP_592011
Protein GI	94969963
COG category	[N] Cell motility
COG ID	[COG1345] Flagellar capping protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.620131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCA CGCTCGATAC CACCTCGCTT TACAGTGGGA AGGGCTTTGA CGTTCAGAGC 
ATGGTCAACC AGATCCTGAA CGCACAACGT ACCCAAGAAG ACCAGTGGAA GAGCCAACAG 
ACCCTAGTCC AGAACCAAAC TTCCGCGTTG ACTGCGATCC AAAGTGAGAT TGGGACCTTT 
TACACAGCCT CAACAAACCT TACAGACTTC AATGGGGTAC TCGGGGCCAA GATCGCAAGT 
TCCTCCGACA CTGGAGCCCT GGTCGCGACT GCGGACTCCT ACGCCACCAC CGGCAAGCAT 
GTGCTTGCCG TGGAACAACT CGCGACAACC GGCTCTGCAT ACTCGACGGC AATCGCCTCC 
GGAGATTCGC TCGACTCAGG CTGTTTCGAT CTGACGGTCG GCTCCACGAC CAAGACGGTG 
ACCTTGGGCG ACGACAATTC CACACTCTCC GATGTTGCTG ACGCTATTAA CAAGCTCGGT 
ATGGGAGTCA CGGCGGCAGT CCAGACTGAT GCGGCGGGAT CTCGGTTGAC CATCGTAAGC 
AACACGTCGG GCTCTGCGGG AGCGTTGAGC ATTAGTGGTG GAACATCGCA ACTTAGCTTC 
AATGTGACGA AGGGACAGAA TGCAATCGTT GACGTAGATG GGGTCCCGTA CGAGTCAGCC 
AGCAATACAG TGGATGGTGC GATTTCCGGG GTGACGCTTA ATCTCGCCAC CGCGAATCCG 
GACAAGCAGG TCACGCTCTC GGTCTCGCAG GACGCAACCC AGGTGGCGCA AGCCATTGGT 
GATTGGGTCG ATTCGTACAA CGCACTTGTG AAGTCAGTCA ATACGCAGTT TTCCTACAAC 
TCCACAACGA ACAGAGCGGG AGCACTTTCC GGCGACAGTT CCCTGCGCCT GCTGCAAGAT 
TCCCTGCTCC ACTTGGCCCC GTTCTCTATG GACGGCAACG GCGACTACGG CACGTTGCGT 
TCGATCGGGA TTGACATGGA AGACGATGGA ACGCTCTCGG TCGACAGCAC GACATTGAAC 
GATGCCCTTG CGAACCATTT TTCTAACTTG ACTTCATTCT TCCAGGGAGA AAACAGCTTC 
GGAACAACGC TGAGCAGTGC GGCGCAGATG CTCGAAAGCC CGACCGTTGG CCCGATTTCG 
CTCGATTTGC AGACCCTGCG ACAGACGAAC CAGGACCTGA CTAACGAAAT CTCAGATTTC 
GAAACTCGGC TCGCTTCGCA GCAGCAGACG CTGCTTTTGC AGTACTCGCA GATCAACGCT 
GCCCTGCAGG AGCTCCCCTC TTTGCAAAAC CAGATTTCGC AGATGCTGGA TTCCACCAGC 
ATCTCTTCAA CGAGTAAATG A

Protein sequence

MTITLDTTSL YSGKGFDVQS MVNQILNAQR TQEDQWKSQQ TLVQNQTSAL TAIQSEIGTF 
YTASTNLTDF NGVLGAKIAS SSDTGALVAT ADSYATTGKH VLAVEQLATT GSAYSTAIAS 
GDSLDSGCFD LTVGSTTKTV TLGDDNSTLS DVADAINKLG MGVTAAVQTD AAGSRLTIVS 
NTSGSAGALS ISGGTSQLSF NVTKGQNAIV DVDGVPYESA SNTVDGAISG VTLNLATANP 
DKQVTLSVSQ DATQVAQAIG DWVDSYNALV KSVNTQFSYN STTNRAGALS GDSSLRLLQD 
SLLHLAPFSM DGNGDYGTLR SIGIDMEDDG TLSVDSTTLN DALANHFSNL TSFFQGENSF 
GTTLSSAAQM LESPTVGPIS LDLQTLRQTN QDLTNEISDF ETRLASQQQT LLLQYSQINA 
ALQELPSLQN QISQMLDSTS ISSTSK