Gene Tery_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2056
Symbol
ID	4245704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	3207590
End bp	3209005
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	34%
IMG OID	638107167
Product	protein of unknown function DUF224, cysteine-rich region
Protein accession	YP_721770
Protein GI	113475709
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCA AAGACATAAG TATTCAAAGT AATCCAACAA TTCCAGCGAA AGATAGCAAA 
TTTTTACAGC AAAATCCACA CTTGCAATCT GACTTAGATC ACTCTAGTTT TGACTCTAAA 
AATCCACCAT CACCAGAATT AATTGGTGCC TGCGTCCACT GTGGATTTTG TTTATCAACA 
TGTCCTAGTT ATCGAGTAAT AGGCAAAGAA ATGGATTCTC CCAGGGGCAG AATTTATGTT 
ATGGATGCTA TTAACAATGG AGAAGCATCT TTAAATCAAA CAAGTTCTCA ACATTTTGAT 
ACTTGCTTAG GTTGTCTCGC TTGTGTAACT ACTTGCCCTT CAGGAGTTAG ATATGATAAA 
TTAATTGCTG CAACTCGCCC ACAAGTAGAA CGAAACATTC CCCGTTCATT ACCTGATAAA 
TTAATTCGTA GTCTGATATT TAATTTATTT CCTTATCCTA ATAGATTACG ACCTTTACTT 
ATTCCTTTAT TTATTTATCA AAAATTAGGA TTTAACAAAC TAATTCGTAG TAGCAAATTA 
CTTGATAAAA TATCTCCTAG ATTAGCAGCA ATGGAATCTA TTCTACCAGA AATTACAGTT 
GATTCTTTCT CTAATAATTA TCCAAATATT ATTCCGGCTG AAGGAGAAAA ACGTTATCGA 
GTTGGTTTGA TTTTAGGTTG TGTTCAAAGA ATATTTTTCT CCTCTGTTAA TATGGCAACA 
ATTCGAGTTT TAACTGCTAA TGGTTGTGAA GTTGTGATTC CTAAAAGTCA AGGTTGTTGT 
GCTGCATTGC CAGAACATCA AGGACAAACC GAACAAGCTC ATGCTTTGGC AAAACAAATG 
ATCGATAGTT TTGTAAATAC AGGAGTTGAT GCAGTTATTA TTAATGCTGC TGGTTGTGGT 
CACACTCTTA AAGAATACGA TAATATTCTA CAGGATGATT CTGAGTATTG TGACAAGGCA 
AAAGAATTTT CTAATAAAGT TAAAGATGTG CAAGAATTCT TAGCAAATGT AGGATTGACA 
GCTAAACTTT ATCCTTTGGT TGAGGAAGAA GAATTGACTA TAGTTTATCA AGATGCTTGC 
CATTTGTTGC ACGGTCAAAA AATTAGTTTA GAACCTAGAA AATTGCTGCT AAAAATTCCT 
GGGGTGAAGT TGCGTGAACC TATAGATGCA GCTTTATGTT GTGGAAGTGC GGGAGTCTAT 
AATATGCTAC AACCGGAAAC AGCTAATGAA TTAGGAGAAC AAAAAGTAGA AAACTTATTG 
AATACAGGTG CAGAATTAAT TGCTTCTCCT AATCCTGGAT GTTCTTTACA AATTAAAAAG 
CATTTAGATT TGCAAGGTAA TAATATGAGT TTAATGCACC CAATAGAATT ATTAGATTAT 
TCAATTCGGG AGGTAAAGTT AAATCTAAAA AAGTAA

Protein sequence

MDLKDISIQS NPTIPAKDSK FLQQNPHLQS DLDHSSFDSK NPPSPELIGA CVHCGFCLST 
CPSYRVIGKE MDSPRGRIYV MDAINNGEAS LNQTSSQHFD TCLGCLACVT TCPSGVRYDK 
LIAATRPQVE RNIPRSLPDK LIRSLIFNLF PYPNRLRPLL IPLFIYQKLG FNKLIRSSKL 
LDKISPRLAA MESILPEITV DSFSNNYPNI IPAEGEKRYR VGLILGCVQR IFFSSVNMAT 
IRVLTANGCE VVIPKSQGCC AALPEHQGQT EQAHALAKQM IDSFVNTGVD AVIINAAGCG 
HTLKEYDNIL QDDSEYCDKA KEFSNKVKDV QEFLANVGLT AKLYPLVEEE ELTIVYQDAC 
HLLHGQKISL EPRKLLLKIP GVKLREPIDA ALCCGSAGVY NMLQPETANE LGEQKVENLL 
NTGAELIASP NPGCSLQIKK HLDLQGNNMS LMHPIELLDY SIREVKLNLK K