Gene Tery_1244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1244
Symbol
ID	4242171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	1926211
End bp	1927449
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	35%
IMG OID	638106454
Product	von Willebrand factor, type A
Protein accession	YP_721065
Protein GI	113475004
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.427731
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.129489
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTA ATCTACGTTC GGCTCTCAAT GATACTAATA TTGATGCTTC TCAATCTTTA 
TCTCAACGGC AAGTGGCCTT ATCTATTTCG GTGATGGCTA ATCAGCTAGA AAGGACTGTA 
CCATTAAATT TATGTTTAAT TTTAGACCAC AGTGGTTCTA TGGAAGGAAG ACCACTAGAA 
ACGGTTAAAC AAGCAGCAGT ACAACTTGTG GAAAAATTGA AGGAAGGCGA TCGCCTTTCG 
GTTGTAGCTT TTGACCATCA AGCTCAAGTA ATTGTTCCTA ATCAGATGAT CAATGATTCT 
GCTAGTATTA AGGGTAAAAT TAATAAATTA AGAGCCTCTG GTGGTACTGC TATTGATAAA 
GGTTTAAAGT TAGGAATAGA AGAATTAAAT AAGGGTAGAA AAGAGTCTAT TTCCCAGGCT 
TTTATATTAA CTGATGGAGA AAATGAACAT GGGGATAATG ACCTTTGTCT CAAGCTAGCA 
AAGTTAGCAA CAGACTATAA TATTACTCTA AATTCTCTAG GATTTGGTGA TGATTGGAAT 
CAAGATGTTT TGGAAAAAAT TGCTGATGCT GGAGGGGGAA ATCTTTCCTA TATTCAACAA 
CCAGAACAGG CAATAGAGGA GTTTAGTAAA TTATTTAATC GCATTAAATC TGTAGGAATT 
ACTAACTCTT ATTTGCAATT TTATTTAATG CCTAAAGTGA GGTTAGCAGA ACTTAAACCT 
ATTGCACAAG TGGCACCAGA TACTATTGAG TTGCCAGTAA AAAAAGAGGG TAATGGGTTT 
ATAGTTAGAC TGGGAGATTT AATGAAAGAT ATAGAAAGGG TGGTTTTAGT CAATACTTAT 
ATTGGGCAAT TACCAGAAGG AAAACAAGCA ATTGCTCAAT TACAAATTCG TTATGATGAC 
CCTGCTCAAA ATCAAGAAGG TTTACTTTCA GAATCAATTT TAGTTGAAGC TAATTTTATG 
GAAAAATACC AGCCTCAAGT TAACTCTCAA GTACAAAATC ATATTTTAGC TTTAGCAAAA 
TATAGGCAAA CTCAAATAGC TGAAACAAAA TTACAACAGG GTGATAGAGC AGGTGCAGCT 
ACAATGTTAC AAACAGCAGC TAAAACAGCA TTACAAATGG GAGATACAGG AGCTGCAACT 
GTTTTACAAA CTAGTGCTAC TCGCTTACAA GATGGGGATA AACTTTCAGA AATGGAACGT 
AAAAAAACAA GAATTGTTTC CAAAACCATT TTAAAGTAG

Protein sequence

MKVNLRSALN DTNIDASQSL SQRQVALSIS VMANQLERTV PLNLCLILDH SGSMEGRPLE 
TVKQAAVQLV EKLKEGDRLS VVAFDHQAQV IVPNQMINDS ASIKGKINKL RASGGTAIDK 
GLKLGIEELN KGRKESISQA FILTDGENEH GDNDLCLKLA KLATDYNITL NSLGFGDDWN 
QDVLEKIADA GGGNLSYIQQ PEQAIEEFSK LFNRIKSVGI TNSYLQFYLM PKVRLAELKP 
IAQVAPDTIE LPVKKEGNGF IVRLGDLMKD IERVVLVNTY IGQLPEGKQA IAQLQIRYDD 
PAQNQEGLLS ESILVEANFM EKYQPQVNSQ VQNHILALAK YRQTQIAETK LQQGDRAGAA 
TMLQTAAKTA LQMGDTGAAT VLQTSATRLQ DGDKLSEMER KKTRIVSKTI LK