Gene Tery_3919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3919
Symbol
ID	4244002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6054014
End bp	6055195
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	37%
IMG OID	638108842
Product	hemolysin-type calcium-binding region
Protein accession	YP_723424
Protein GI	113477363
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.525194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATA TTTTAGGAGA TGACAATAAT AACTTCTTAA TAGGTTCTCC AGAACCTGAC 
CTTATGGAAG GTTTTGGTGG AAATGACACT ATTTTTGGTG AAAAAGGAGA TGATACTCAA 
AGCGGAGGAG ATGGAGTCGA CGAAATTTTT GGTGGCATTG GATCTGATTC TTTAATTGGT 
GGTGAAGATA ACGATTTTCT AAAAGCAGAA GATGGACGCG ACTTAGCATT TGGAGGTCCT 
GGAGATGATA GTATTGAAGG TGGTCCCGGA AATGATACCC TAACAGGAGA AAATGGCAAC 
GACTCTTTAT TTGGAGAAAC TGGAGATGAC CTTATAATAG GTAGCCAAGG ACTTGATTAT 
ATTATTGGAG GAGGAGGTAA CGATACATTA AGAGGTAATC AAGGGAATGA TAGTCTAGTT 
GGAAATGTTG ATGATGATCT AATATTTGGG GACCAAGGAA ACGATACTGG CAGTGGAGGT 
ACAGGTAATG ATTCTCTTTT AGGTGGTGAT GGTGATGACT CTTTAGACGG AGGTAGTGGT 
AATGATACTA TATTTGGTGA ATCAGGTAAC GATTCTCTAT TTGGCATTAT TGGCAGTGAT 
TTTATTAATG GTAATAGGGG TAACGATCAA GTTTTTGGTG GAGAAAATGC AGATAATCTT 
CGTGGTGGAA AAGGTAATGA TACAATATTT GGAGAACTTG AGAATGACTC TCTCTTCGGT 
GACTCAAACA ACGACCTAGT TATTGGTGGT ATTGGTGATG ATACATTGTT TGGTGGAAAG 
AATAATGATA CCCTTCAAGG TAGTGATGGT AATGACTCTT TGTTAGGGGA TCTAGGCAAC 
GATATATTAT TTGGAGGTGG GGGAGAAGAT ACATTAACTG GTGGTGAGGG AGAAGACACT 
TTTGTACTAC CTGGAGAACT AGGTAGTATT GATATAATTA ATGATTTTAA TCCCTTAGAA 
GATTTCTTAG CTTTAAGTGG TAATTTAACT TTTGAGGATT TAAGTTTTCA ACAACAAACT 
GGCTTAAACT TCAGAGATAC ATTAATCACT ATTAATAATG ACAGATTATT AGCCATATTA 
GTAAATGTTC CAGCCTCCAT AATTTCAGAG AAAGACTTCA TAGATGTTAG CCAACCTTTA 
CTTGATTTTG ATTCTAAGTA TACTGGCAAT GAAGTTTTAT AA

Protein sequence

MANILGDDNN NFLIGSPEPD LMEGFGGNDT IFGEKGDDTQ SGGDGVDEIF GGIGSDSLIG 
GEDNDFLKAE DGRDLAFGGP GDDSIEGGPG NDTLTGENGN DSLFGETGDD LIIGSQGLDY 
IIGGGGNDTL RGNQGNDSLV GNVDDDLIFG DQGNDTGSGG TGNDSLLGGD GDDSLDGGSG 
NDTIFGESGN DSLFGIIGSD FINGNRGNDQ VFGGENADNL RGGKGNDTIF GELENDSLFG 
DSNNDLVIGG IGDDTLFGGK NNDTLQGSDG NDSLLGDLGN DILFGGGGED TLTGGEGEDT 
FVLPGELGSI DIINDFNPLE DFLALSGNLT FEDLSFQQQT GLNFRDTLIT INNDRLLAIL 
VNVPASIISE KDFIDVSQPL LDFDSKYTGN EVL