Gene Tery_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3801
Symbol
ID	4242251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	5842271
End bp	5844271
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	32%
IMG OID	638108735
Product	glycosyl transferase family protein
Protein accession	YP_723319
Protein GI	113477258
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.361968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTAA TACAACAGTT AGAAAATTTC AAAAAAATTA AAGCCAAACA AAAAAAATAT 
CTTTTAATAT TAACACTTTC TATTTTATAC CTCTGTTTAC TTGCTTCCTT AGCCTTCTTC 
TATAACCTTG GTAATATTGG TTTAATTGAT GAAACAGAAC CAATTTTTGC CGAAACTGCT 
CGTCAAATGG TAAAAACTGG AGATTGGATT ACACCTTATT TTAATGGAGA AACTCGCTTT 
GATAAACCAC CTTTAATTTA TTGGTTAATA GCAATTTCTT ATCATCTTTT TGGTATTAAT 
GAATGGTCTG TCCGTCTCCC ATCAGCAATA TCTGGAACCG GCTTAATGTG CCTTGGTTTT 
TATACCCTCT ACAGATATGG TTATTATCAC CTGAATCCTC AAATATATAC CCCTAAAAAT 
AAACTTTTAA TAGTGAAATT ATTAATAGGA TATATTGGGG CAGCGATGAT AGCCATAAAT 
CCAGAAACTA TTGTTTGGGG ACGTATAGGA GTTTCTGATA TGTTATTAAC AAGCTGTATG 
TGTTCAGCAC TACTAGCCTT TTTTATAGGA TATGCTTCAC AAACAGAAAA TGCTCTTATA 
CATCAGCAAA AAAACAGCAA AATCATCATA CAGAAAACCT CTTATTTACC AAATCAAAAT 
CAATCCTCAA AACCTAGAAA ATCTCCCCTA TTCAACAAGT GGTATTTAGC CTTTTATATA 
CTAATATCTT TAGCAGTTCT CACCAAAGGT CCCATTGGAA TTGTTTTACC AGGAATAATT 
ATTGGTTCCT TTTTATTATA TGTAGGTAGA CTTTTTAAAG TCTTGCAAGA AATCAAAATT 
TGGTATGGAA TTTTAATTTT TTTTACCATT ACATTCCCTT GGTATTATCT AGTTACCTTG 
GTAAATGGAA AAGAATACAT TGATAGTTTT TTTGGGTATC ACAATTTTGA ACGTTTTACC 
AGAGTTGTGA ATCACCATCA AGGACCGTGG TATTTTTACT TTTTAGTCGT ACTAATTGGT 
TTCGCTCCCT GGTCTATTTA TTTACCAGTA GCCATAGCTA AAACTAAGTT TTGGCAACCC 
TATTATTGGC GTCATAAACC GAGAAATAAA CAGTTAGGTT TATTTGCCTT TTTCTGGTTT 
ATTTGTATCT TTGCTTTCTT CTCCATCTCT GCTACTAAAC TACCTAGCTA TGTCTTACCA 
ATAATGCCCG CCGCAGCAAT ATTATTAGCA CTATTTTGGA GTAATATTAT TCTTCACAGA 
TATTCTCTAT CTAGTCAGAC TAATAAACCT GAAAATAACT CCACTCAATC ATCATTTAAA 
GCCACAAATA ACCCTACTCA ACCTATTTCC AGATTAACGA GAAATACTTC TAAATCAAAA 
AGTAAATTTT TATCTTTCTC AGTTGTCGCC AACATTATTT TTTTGTTGAT TTTAGCCTTA 
GCAATTATCT ACAGTTTTAA CTGGTTAGAT AGAGACCCAG CCATGCCATA TTTCTCAGAA 
ATAATTAGAA AATCTGGCTT ATTAATTCGT GGTGGCTTAA TTTTAATAAC CACAGCAATA 
GTCATTGGAT TTTTTGTCAT AAAAAAACAA AATTCTTGGG TTTGGAGTGC TAATTTTATT 
GGGTTAGTAG CTTGTTTAAT TTTTACTATT AACCCGATCA TGTTTTTAGT AGATCAAGAA 
CGTCAATTAC CTTTACGTCA GCTAGCTCAA ACTATTATTC AAGCCAGACA ACCAGGAGAA 
GAAATAATTA TGGTTAGCTT TGAAAAACCT AGTTTAGTTT TTTATACTAG GCAACAAGTA 
AAATTTTTTC GACGTGCTAC AGATGCCAGA GAATATCTAG GGAAAAATCT CTCAAAAAAC 
TCTTCTGATA ATGTATTGAT AATTGGCTAC CCAAAAAAGT TTATTCATAT AGGATTAAAA 
CCAGGGCAAT ATCAATATTT AGACAGTCGT GGTGCTTATC AATTAGGTAA AGCTCCTAAA 
AATATCTTTT TACCAAAATA A

Protein sequence

MKLIQQLENF KKIKAKQKKY LLILTLSILY LCLLASLAFF YNLGNIGLID ETEPIFAETA 
RQMVKTGDWI TPYFNGETRF DKPPLIYWLI AISYHLFGIN EWSVRLPSAI SGTGLMCLGF 
YTLYRYGYYH LNPQIYTPKN KLLIVKLLIG YIGAAMIAIN PETIVWGRIG VSDMLLTSCM 
CSALLAFFIG YASQTENALI HQQKNSKIII QKTSYLPNQN QSSKPRKSPL FNKWYLAFYI 
LISLAVLTKG PIGIVLPGII IGSFLLYVGR LFKVLQEIKI WYGILIFFTI TFPWYYLVTL 
VNGKEYIDSF FGYHNFERFT RVVNHHQGPW YFYFLVVLIG FAPWSIYLPV AIAKTKFWQP 
YYWRHKPRNK QLGLFAFFWF ICIFAFFSIS ATKLPSYVLP IMPAAAILLA LFWSNIILHR 
YSLSSQTNKP ENNSTQSSFK ATNNPTQPIS RLTRNTSKSK SKFLSFSVVA NIIFLLILAL 
AIIYSFNWLD RDPAMPYFSE IIRKSGLLIR GGLILITTAI VIGFFVIKKQ NSWVWSANFI 
GLVACLIFTI NPIMFLVDQE RQLPLRQLAQ TIIQARQPGE EIIMVSFEKP SLVFYTRQQV 
KFFRRATDAR EYLGKNLSKN SSDNVLIIGY PKKFIHIGLK PGQYQYLDSR GAYQLGKAPK 
NIFLPK