Gene Acid345_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2058
Symbol
ID	4070600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2468730
End bp	2469779
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	57%
IMG OID	637984072
Product	von Willebrand factor, type A
Protein accession	YP_591133
Protein GI	94969085
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID	[TIGR03436] VWFA-related Acidobacterial domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCGA ATCCTGCGCT GGAGCGTCTT ACTAAGAACC CGATGCCTCG TATCGCCTTG 
TTCATCCTGG CTTGCGCCGT GTTTGTGTCT GCCCAGGAGA ATCCTTCGCA GCCGCCCCAG 
CAGCCGCCAG CCGGAAAGCC CATTCCTAAC CATACTGTCC CCAAGCCGCC GAACGCCGGG 
CAGAAATCCA CCGACGACCA GCCTTCCACG ACCTTCAAGG TCAGCGTAAA GCTCGTCAAC 
GTGTACACCA CGGTGGTAGA CCAGCACGGT GCGCCAGTAG GGAACTTGAC CAAAGACGAC 
TTCAGCATCA CCGAGGATGG CAATCCGGAG AAGATTGCGC TTTTTCAGAG GGAATCGGAG 
CTTCCTCTAT CTATTGTAAT TGCAATTGAT GCGAGCGGAA GTACAAAGAA AGACTTGAAG 
TTAGAGACGG ACTCCGCGAA GCGCTTCGCG CGCGACATTT TGCGGCCCCA GGACCGGCTG 
AGCGTGTATG CCTTCAGCGA GACCGTGGAA GAGATCGTGC CGTTTACTTC GGACTTGCGC 
CGGATCGACC GCGGAATCTC GGAGATTATC GCTGGTTCCG CCACCGCGAT GTACGACACC 
ATCTTTCTGG CGTCGAAAGC GTTGATGAAG CACGATGGAC GGAAGGTGAT GGTGCTCATC 
ACCGACGGCG GCGACACCTT CAGCAGCACC AGTTACGAGC AGGCGGCGCG CGCGGCTACG 
CAAAGCGAGA CATTGTTGTA CAGCATTATC GTTGTGCCGG TGGCAAACAG CGCCGGGCGC 
GATACGGGCG GGGAACACGC GCTGATCCAG ATCTCGCAGG ACACCGGCGG GAAGCACTAC 
TACGCGACCG ATATGGGCTC ACTCGACGTT GCGTTTAAGC AAATATCCGA CGAGTTGCGG 
ACGCAATATT TGATTGGATA TTACCCATCG CGGCGTCTGG CATCGTCGGA CTTTCGACGG 
ATTGATTTAC AGCTTGCGCC GGGAGTTGCA AACCGGAACC TGCTGCAAGT GCGGCACCGT 
GTGGGCTATT ACACGAGCCC GTTGGAATAA

Protein sequence

MLANPALERL TKNPMPRIAL FILACAVFVS AQENPSQPPQ QPPAGKPIPN HTVPKPPNAG 
QKSTDDQPST TFKVSVKLVN VYTTVVDQHG APVGNLTKDD FSITEDGNPE KIALFQRESE 
LPLSIVIAID ASGSTKKDLK LETDSAKRFA RDILRPQDRL SVYAFSETVE EIVPFTSDLR 
RIDRGISEII AGSATAMYDT IFLASKALMK HDGRKVMVLI TDGGDTFSST SYEQAARAAT 
QSETLLYSII VVPVANSAGR DTGGEHALIQ ISQDTGGKHY YATDMGSLDV AFKQISDELR 
TQYLIGYYPS RRLASSDFRR IDLQLAPGVA NRNLLQVRHR VGYYTSPLE